路舟走后,陸銘回到了實驗室內。
他一邊走到后排,吩咐助手將新買的顯卡拆出來安裝。顯得要老舊點的是他從住所搬過來的GTX280,而大多則是微訊的員工送過來的英偉達最新型號GTX580。
去年DanC.Ciresan發表的論文堪稱震驚世人。論文中采用了GTX280來處理數層的神經網絡。而在此之前,神經網絡的發展是一直苦于CPU的處理速度限制,而即便是要使用GPU,也得為特定的問題制作特定的算法。
而說來讓陸銘覺得巧的是,路舟年前給他提這事還讓他頗為頭疼。但就僅僅幾天前,DanC.Ciresan新發布的論文提供了一種快速、可參數化的卷積神經網絡,這可當真是瞌睡了來枕頭。
當然,對陸銘來講麻煩事自然也有,比如數據集的問題、實習生的水平問題、最終實際應用的問題。
而這些都得靠時間一點點解決。
陸銘想了想就笑了起來,他是沒多大心態變化,反而是更加期待這接下來的工作。
反正天大的事也不是他陸銘頂著,這背靠著小學弟他也就安心研究便是。
......
兩周后,夢谷云低調上線了眾包平臺。
大多數關注到消息的網民第一反應,“?!”
盡管眾包的模式并不算新鮮,但讓人感到新鮮的在于眾包中的項目。
夢谷眾包分了數個欄目:語音轉文字、圖片轉文字、圖片標注和分類、臉部照片和視頻、腳部照片等。
前頭兩項按照提交的量計費,而后兩項則是一次計費。
有眼尖的互聯網從業者這就認出了這夢谷眾包模仿的是亞馬遜眾包。須知,著名的image中就有大量來自亞馬遜眾包的數據集。
夢谷云這是要搞事情啊?有沒這么牛逼?
當然,外頭怎么猜怎么想是別人的事情。
一周后。
此時的路舟正在前往鄭市的飛機上。說來,這是他第一次去這城市。
路舟身邊是坐了夢谷推廣廣南分公司的經理周凱。身后的周達和王強東倒不是必要來的,不過是和周凱相熟一起合作所以也是跟了過來。
事情的倒也簡單,無非還是AI那點事,需要一些下游的公司來處理一些業務。
在陸銘的實驗室研究項目開始運轉后,路舟先是安排了微訊向海天瑞聲購買了一批語音庫供陸銘研究使用。
海天瑞聲是早在98年開始就做著語音標注的業務。路舟所買下的語音數據庫,里頭的結構可以看成是一段語音對應一段文字。這樣的庫被廣泛地用于訓練AI,做語音識別或者轉換等領域。
至于這些庫的源頭?那自然是人工聽取再標注出文字數據。
而有語音標注,自然就也有圖片、視頻。這些都被稱為數據標注。一個神經網絡搭建后,需要用到的訓練數據便大多是來自于這里頭。
夢谷云上線眾包或者路舟這次來鄭市的目的也在于此,找人,認數據,練AI。
至于裨益,那簡直是全方位的。幾乎所有夢谷內的產品都能有所獲益。
“周凱。”
“老板請講。”
路舟擺了擺手,“叫我路舟吧還是。說說,你是怎么就這么大膽公司剛上眾包一個月,你這就敢拉起工作室來搞的?”