因此,國際上的人工智能研究分成了兩派。
一派是模仿人的鳥飛派,一派是數據驅動派。
而后者之所以沒有迅速發展起來,主要是因為數據獲取非常困難。
第一,當時沒有機讀資料。
第二,很多文學明珠不同版本分散在不同國家,并且其翻譯常常不是一一對應。
當然還有很多其它原因就不一一細說了。
但,這個困難在互聯網時代被改變了。
它的出現,讓研究機構可以輕易獲得全球的機讀資料。
而且數據量還在隨著互聯網的發展,每年呈幾倍,甚至十幾倍的增長。
在龐大的數據支持下,從1994年到2004年的十年里,語音識別的錯誤率減少了一半。
而機器翻譯的準確性提高了一倍。
其中20的貢獻來自方法的改進,80來自數據量的提升。
再就是今年2月份,在美國召開的全球機器翻譯系統大賽。
鴻蒙和googe通過數據驅動的方法,取得了50以上的bleu分數。
比著名的南加州大學、ibm沃森實驗室等研究機器翻譯幾十年的頂尖研究機構領先了5。
而提高這五個百分點在過去需要研究510年的時間。
在到英文的翻譯中,鴻蒙的得分比第三名領先了17,同樣采用數據驅動方法的googe比第二名領先了15,這個差距已經超出了一代人的水平。
而鴻蒙和googe都是成立不超過十年的新公司。
在人工智能研發上的底蘊肯定沒有南加州和沃森實驗室深厚。
但我們卻超過了他們。
原因是我們比他們更優秀嗎?
不是。
那么差距是怎么產生的?
很簡單。
作為全球最大的兩個搜索公司,鴻蒙必應和googe都擁有龐大的搜索數據庫。
&t;divtentadv>而且我們每年都在對全球所有的圖片、圖書、報刊數據化。
這讓我們掌握著全球最大的數據庫。
南加州大學和ibm沃森實驗室雖然人才比我們多,研究基礎比我們深厚。
但他在數據量上遠遠不如必應和googe。
所以,他們落后了。
這次比賽的結果在人工智能領域產生了巨大的影響。
從我們得到的消息來看,全球絕大部分科研機構都放棄了傳動的鳥飛派方法,改用了數據驅動的方法。
也就是說,2005年將成為全球人工智能領域的分水嶺。
從今年開始,鳥飛派將被徹底拋棄,數據驅動將成為唯一的主流。
我相信,隨著數據量的不斷累積,人工智能會變得越來越智能化和實用化。
將會對社會的方方面面產生深刻的影響。”
完全進入自己節奏的徐良,已經不需要稿子了。
這一刻,他完全放下了雙方的身份。
全然把臺下的人當成了聽眾。
而他們也徹底被徐良言語中的內容吸引了全部的注意力。
“未來的農業,將徹底擺脫華夏幾千年來,消耗大量人力物力,精耕細作的農業模式。
取而代之的是智能化農業工廠。