楚垣夕心說我特么搞了大半年的自媒體,就相當于一閉眼一睜眼的功夫,特么從科技到市場居然竄出去這么老遠!然后他轉念一想,蒼天啊大地啊,終于不用再用傻逼GPS了!
這其實是楚垣夕心中最可能阻撓小康線上內容展開的一個技術頑疾了,按照原世界中的思維邏輯順下來,還準備調集資源攻堅呢,沒想到已經基本不藥而愈,剩下的工作無非就是蘇顧去市場上尋找最適合項目的資源而已。
沒想到,從蘇顧這邊出來,薛明那邊突然又報告一個好消息。《亂世出山》海外的熱度之所以比國內差一些,除掉其它原因,隨機劇情的翻譯是個很大問題,技術上人工智能翻譯的水準降低玩家體驗。
解決辦法有兩個,一個是用兩國語言大量樣本訓練薛明的AI進行深度學習,有無法克服的困難,另一個就是提高翻譯AI的質量。
問題是翻譯這事讓巴人來做有點性價比太低了,之前接入的已經是國內最好的AI翻譯套件,讓薛明自己訓練一個AI進行翻譯大概率還不如人家呢。
所以不了了之。
但在剛剛過去的2月份,硅谷的OpenAI放出一個衛星,發布了一個語言類通用型AI,使用語言建模技術,能編能翻還能總結摘要,名字叫做GPT-2。之所以是2,因為GPT的一代目早就推出了,采用相同的原理,但性能一般。
而二代目則不然,極大的擴充了訓練參數集,達到驚人的15億個參數,而且調整了對AI的訓練方式,使目標變得極簡——預測,通過文本中前面的詞進行歸納,預測下一個詞,生成文章。
這個設計思路超凡脫俗,方式完全不是人類的學習方式,但是效果竟然出奇的好,因為調整后主打思路是“歸納預測”,所以可以不進行任何針對性訓練,暴力橫掃所有語言學相關的領域。
比如翻譯,翻譯中最難把握的是語境而不是語法與句式結構,但這套AI人家不用學習語境,直接通過算法歸納前文語境,然后“預測”出下面正確的詞句。當然作為翻譯AI來使用的話還需要一個小的輸出轉換校驗模型,比撰寫和總結稍微復雜。
“你的意思是,咱們可以用它?然后外國玩家就能看到原汁原味的隨機對白了?”
“呃……還不行,只能用一個1億參數的閹割版本的,但是效果肯定比現在的好。”薛明比較尷尬的說:“這次OpenAI沒完全開源。”
“啥?他們不是號稱全開源的嗎?”楚垣夕大為光火,仿佛在說:免費的大餐怎么能提供的不到位呢?