這相當于把一個問題拆成兩個。其中后一個問題不需要什么新的工作量,而前一個問題,因為是定向解決到英語區國家推廣的問題,不用考慮翻譯成多國語言,也不用考慮普適性,只需要解決針對《亂世出山》的單一問題,于是變得非常直接。
這就變成了最簡單的機翻的問題了,一本幾百萬字,幾十萬本,無非就是一萬億字的體量,只要有優秀的翻譯算法和配套算力用于翻,不是問題!
問題是沒有合適的算法和算力。
理解自然語意比較常用的模型里,百度的ERNIE適合漢語任務,而谷歌的BERT2.0雖然漢語英文都可以,但是主要創新點都在預訓練上。對于長句語意的理解還行,但對翻譯既不友好也不那么準確,特別是完形填空能力比較一般,連百度都不如。
而薛明要的是翻譯,比翻譯普通文本的要求高很多。BERT2.0的翻譯實力翻個普通的文本都勉強,翻根本沒法用。
所以還是OpenAI的GPT-2最合適,哪怕是閹割過的GPT-2。
于是問題轉了一個超大的圈子又回到最開始訓練GPT-2模型的問題了,谷歌的TPU云資源最合適,退而求其次的選項是國內的一些私有云。
這個問題必須解決,否則如果還是原先的翻譯水平,經過島國和宇宙兩個區的實踐,《亂世出山》手游海外運營的天花板實在是太低了,強行降低一半多的高度,簡直不能忍。
所以今天楚垣夕必須來找谷歌要機會,國內的私有云實在是一言難盡,可能必須向中曙光或者江南計算申請算力了,麻煩地令讓人頭禿。
那么,谷歌會如人所愿么?
楚垣夕帶著周敏溪轉悠出來,把這個麻筋給周敏溪一說,周敏溪當時就蹦出一句:“那可是谷歌啊!”
然后她陷入深度懵逼的狀態。巴人就算再牛逼,那也是一條小魚,甚至在天朝內部都是小魚蝦米級別的,而谷歌是這顆星球上首屈一指的公司。“獅虎,你打算怎么要這個算力?靠你俊朗的外形嗎?”
“不但要靠俊朗的外形,還要靠有風度的著裝。”楚垣夕故作神秘的一笑,十分騷氣的雙手抻出格子衫的左右衣角,“你獅虎我可是準備了秘密武器的。”
說話間他們已經走到分會場的邊角,沒什么人的地方,連會場中嘈雜的聲音都變輕了。
“什么秘密武器呀?該不會是……”周敏溪左右看看,附近人不多,腦子里頓時相當凌亂,心說支開莫妮卡把我單獨帶出來,還帶到這么偏僻的地方,難道是楚垣夕準備的秘密武器是讓我……
“你猜是什么呀?”楚垣夕促狹的眨眨眼,周敏溪張張嘴,試探著說:“是,美女?”