加爾文停頓了一下,謹慎回答:“如果有更多資源支持,我們可以在六個月內開始擴展系統。不過,我們還需要繼續優化算法和擴充語言數據庫。”
麥克納馬拉鼓掌,轉身對沃森說道:“沃森先生,恭喜,你們將獲得國防部的訂單。”
然后接著對林燃說道:“教授,我就知道你肯定能做到。”
最后才是加爾文:“加爾文教授,國防部后續會跟你聯系。”
林燃說:
“大家也不要太樂觀。
喬治敦只能說能用,離用好還有很遙遠的一段距離。
ibm方面得提高機器的性能,性能越好,它的翻譯準確度就越高。
其次喬治敦大學這邊要繼續沿著我設計的技術路線,不斷挖掘它的潛力。
但這條機器翻譯的技術路線是有上限的。
只有統計學方法上的更新換代,才能實現更好的翻譯效果。
不過等你們挖掘到這條技術路線的上限之后,我建議在這個過程中,喬治敦大學最好多招一些統計學和理論數學專業的博士參與到這個項目中來。
最后是國防部這邊,后續在使用喬治敦機器用于俄語翻譯的時候,其實還是要依賴人工審核。
能夠幫你們提升效率,但提升效率的程度有限,你們不能完全依賴機器。”
其實喬治敦的效果就和最早的翻譯有點類似,純機械式的翻譯。
不會按照語言特性進行優化。
只是因為英語和俄語都和拉丁語系有關,只是有關,相關性不算低。
但肯定比英語翻譯成中文要簡單得多。
“當下這個版本的喬治敦翻譯機器,在軍事、科技這兩個特定領域會表現的比較好,在其他領域,以及對于復雜句和非專業語境下,它的錯誤率會比較高。
俄語是高度屈折語言,名詞有六格變化,動詞有復雜的時態和體,而英語語法較簡單,僅僅依賴詞序和介詞而已。
喬治敦機器想做到準確處理格變化和詞序調整,還是存在比較大的困難。
我們目前也只是通過概率表和上下文窗口緩解了多義詞問題,規則系統確保了基本語法的準確性。
簡單句大概能夠達到百分之八十到九十的準確率,但復雜句,像嵌套從句之類的還是很容易出錯。
對于新聞、外交聲明這種結構清晰的文本,它的效果應該會很好。
但對涉及到大量口語的對話,它很難準確捕捉細微差別,錯誤率可能會達到50%。
我覺得各位需要保持一個謹慎樂觀的態度。”
林燃說完后,臘斯克開口道:“教授,這已經足夠了。
對于目前白宮和國防部的需求來說,它只需要批量處理書面文本,像新聞、報告之類的就已經是很大的作用了。
電話會議這種,我們也沒指望他能夠做到準確翻譯。”
確實,作為一個都快要被判死刑的項目,一年后被砍掉,甚至被認為是ai寒冬,現在被林燃兩個月時間就救回來,當下具備了實際應用價值。
這已經是一種飛躍了。
訪客們陸續離開,興奮的低語在走廊里回蕩。
麥克納馬拉非要去林燃的辦公室坐一會。
“教授,關于你想借閱《mit輻射實驗室系列》,我這邊已經批準了。
最快應該后天ibm那邊就會批準,包括當時的一些雷達設計方案之類的內容我讓林肯國家實驗室一起提供給你。
正好你也看看這方面的內容,看有沒有什么靈感能夠提供給我們。”麥克納馬拉一邊喝茶,一邊說道。
林燃心想,媽的,好人啊!</p>