“這個翻譯軟件應用在用戶體驗上要做到盡量傻瓜式,越簡單越好。”
羅晟望著許勇有條不紊的說道:“例如,如果我不懂英語,我打開一個英語網頁當場傻眼,看不懂。怎么做到呢?當用戶進入一個他完全看不懂的網頁時,他的電腦如果運行了我們的翻譯服務,該頁面的文字信息應該立刻自動翻譯成他的母語文字,這樣他就一目了然。”
許勇思考了片刻便說道:“軟件的兼容問題會成為最突出的矛盾體。”
羅晟笑道:“這一點并不困難,我們完全可以通過云計算服務的相關技術支持來解決這個問題,我們當然不會去改動原網頁,否則頁面會產生崩潰的可能,但是我們可以通過解析然后在云端運行,然后在客戶端呈現一個繼承的子頁,原頁是父項,兩者既獨立又關聯。”
馮毅眼前一亮,道:“這是個可行的辦法,算是一種云服務的開發。”
眾人心中莫名的感到驚嘆,合著這個想法恐怕不是老大剛剛想出去來的,而是在去年甚至更久就已經有了。
坐在這里的人都是具備工程師和開發者的能力,片刻之后便意識到大數據和云計算服務將會在其中起到核心骨架支撐的作用,是實現這一切的前提,而再往前就是人工智能了。
換句話說,這個設想可以把即時翻譯應用包裝在云計算服務進行銷售,可以分為企業級服務和個人服務兩個板塊。
企業級服務,例如藍星科技這樣的網站,其社交屬性和跨國的特性,就很需要這樣的服務,買了這樣的服務支持,藍色空間BlueSpace、微博MicroBlog、藍星視頻BluestarVideo等用戶在登陸這些網站的時候,就不需要購買了,直接就可以免費使用,因為網站本身已經購買了這樣的服務。
當然這本來是就是藍星科技自己的云服務支持,自然是免費的了。
可是別的企業網站呢?例如微軟、例如谷歌、雅虎等等,他們想要這種解決方案,就得購買。
還有個人版也是。
羅晟望著眾人說道:“如果現在就實現強人工智能一切都會變得簡單多了,但這不是一時半刻就能實現的,好在云計算服務可以讓我們提前優化許多應用場景,但這需要超大量的數據和足夠的算力資源來支持,我們的解決方案可采用分布式計算,擁有超大規模的數據中心來支持詞庫的收錄,并且支持實況更新詞庫。”
數據時代,數據就是一切,壟斷了數據,等同于壟斷了全世界。
羅晟補充道:“所以,接下來藍星科技應該要在世界范圍內招募包括語言學家、工程師、分析師、統計學等專業人才、還需要招募語言學的考古隊,當然也可以直接贊助的方式合作,還要派出大量的線下考研團隊深入世界各地去采集各類文化、風俗、俚語等信息,博物館、圖書館等等,可開放的都要采集,不開放的爭取說服對方,給一筆錢或者合作什么的都行。”
許勇笑道:“看來我們也得給維基百科一筆贊助費了。”
當這些數據詞庫等信息都收攏在數據中心,這是一個基本的前提條件,把數據庫建立完成了,才能做到可對照的解析翻譯。
而數據中心的打造會不斷的擴大,因為這個世界每時每刻都在產生新的詞匯,尤其是網絡流行語,這個反而是最容易采集的,能在網絡上解決收錄問題是最簡單的。
難的地方是一些小眾類、線下類的,你還不能忽略,別看他們小眾,但卻分散開來的,統計一下匯總依然是巨量的。
數據庫打造完成了,這對開發人工智能有著巨大的裨益,也就可以通過開發一個巨大的分發系統,通過用戶訪問數據中心請求解析再通過云端而實現用戶的翻譯需求。
如此一來,海量的數據支持也能承載初級人工智能的誕生,最后人工智能再反哺回去,誕生初級人工智能才能往強人工智能升級,這一點在羅晟的上一世已經得到了證明,所以不會有任何懷疑,必須這么做。
許勇琢磨著自言自語:“這是一項浩瀚無邊的超級數據工程,得投入多少人力、物力、財力才能實現?”