第348章饑不擇食的meta
華國古代有句諺語,叫“山中方七日,世上幾千年”,尼蘭詹現在的感覺和這句諺語差不多。
他簡單洗漱一下就被帶往了meta在紐約的總部,扎克伯格用虔誠的表情看著他:“巴拉蘇布拉馬尼安教授,我知道你在人工智慧領域有著超出尋常的造詣。”
尼蘭詹心想,自己這麼難念的姓氏,扎克伯格能念得如此清晰,也真難為他了。
緊接著,扎克伯格的話就開始出乎他意料了。
我在人工智慧領域有著超出尋常的造詣?尼蘭詹在思考這句話,是不是又有什麼坑,不過轉念一想扎克伯格這樣的大佬,世界頂級富豪,不至于要坑他啊。
而且自己身為石溪分校人工智慧領域的教授,說超出尋常的造詣,倒也不是不行。
“我確實對人工智慧頗有自己的一番見解。”尼蘭詹微笑著說道,過去一年多被監獄折磨的日子終于過去,他要迎來新生,自信的笑容丶從容的坐姿丶睿智的大腦終于在他大腦內又占據了上風。
扎克伯格聽完后笑得更開心了,“不愧是倫道夫的教授,我就知道你肯定不一般!”
扎克伯格把尼蘭詹從監獄里撈出來,倒也沒費多大功夫,畢竟他可是驢黨長期鐵桿合作夥伴,給驢黨不知道捐了多少錢。
尼蘭詹又不是真的犯事了,聯邦調查局調查來調查去也沒找到尼蘭詹和阿波羅登月的關系,沒有找到有決定意義的證據。
之前一直關著他,不過是因為把他當背鍋的,一名沒有任何背景的印度裔教授,來承擔華國21世紀率先登月的黑鍋,好像還挺合適。
但當扎克伯格出手時,尼蘭詹又變成了微不足道的小人物,他輕而易舉就把對方給撈了出來。
而且對方能被關一年多,說明應該確實有兩把刷子。
“巴拉蘇布拉馬尼安教授,你對大語言模型怎麼看?”扎克伯格問道。
尼蘭詹大腦開始高速運轉起來,畢竟這可是關乎到自己的安危啊!得表現出價值,他才能在外面一直被保釋,甚至是無罪釋放。
他內心苦笑了一聲:這叫什麼事,自己明明就無罪,現在居然還要表現出價值才能無罪,這國怎?
“我認為這是一個很有發展潛力的方向,我前幾年在acl會議上發表的論文《deforr:dposgpre-traedtransforrsforfasterquestionanswerg》針對的就是transforr-basedqa模型的痛點-全層輸入寬自注意力導致計算慢和內存高予以解決,我提出deforr,一個分解的transforr變體。
在較低層,deforr用問題寬和段落寬自注意力替換全自注意力,避免問題和段落序列的交叉計算。
這允許獨立處理輸入文本,實現段落表示的預計算,從而大幅減少運行時計算。
deforr結構與transforr相似,可直接用預訓練權重初始化,并在qa數據集上微調。
我們的實驗顯示,deforr版本的bert和xl在qa任務上加速4.3倍以上,僅通過簡單蒸餾損失損失1%準確率。”
尼蘭詹說的是他2020年在acl會議上發表的論文,是當時llm優化領域的經典工作,當時llm流行的模型叫bert,這篇論文直接構建在預訓練transforr上,llm的瓶頸,也就是計算成本,在下游任務中凸顯,這篇則一定程度上提出了解決思路。
“包括我在2020年的另外一篇工作,其實和llm的核心,也就是多層注意力有著類似的核心邏輯”
尼蘭詹自然不是水貨,他在人工智慧領域確實浸淫多年,有不錯的成果,手上有好幾篇頂會文章,都和llm有關。
那還是2020年,當時大模型還名不見經傳呢,在人工智慧領域屬于邊緣化的方向。
扎克伯格是花了很多冤枉錢,把臉書改名meta錯誤估計了元宇宙的到來時間,但不代表他沒腦子,單純因為尼蘭詹是林燃的教授,就找他來。
尼蘭詹自己真有幾把刷子,也是很重要的原因。