“玩笑”陳知禮緩緩掀起眼簾,神色看不清情緒“你看見她笑了嗎”
“”成帥怔了兩秒,立即跟唐念道歉“對不起,是我腦子不清醒,我給師妹道歉。”
唐念沒出聲,也沒接受他的道歉。
成帥臉色青一塊白一塊的,被女生拒絕已經很丟人了,ua還被小老板聽見,他真的想死的心都有了。
他張了張口,想給自己辯解幾句,心里又實在有些怕他,只沒敢多話。
陳知禮瞥他一眼,離開前“好心”警醒“再有下次,你自己打包走人,我這里不歡迎夾帶私欲的人,懂吧”
“懂懂懂。”
成帥點頭,戰戰兢兢地離開。
寂靜的走廊剩下兩人,沉默的氣氛有點令人發黃。
是他把她叫過來的,唐念還以為他會主動開口說點什么,哪知陳知禮壓根沒搭理她,轉身就走,留唐念局促地站在原地。
她站著思考了半分鐘,最后還是硬著頭皮跟了過去。
辦公室的門沒關。
唐念敲了敲門,杵在門口罰站。
陳知禮的目光在她身上停了片刻,不帶什么情緒“進來。”
唐念挪了個位置繼續罰站。
陳知禮抬了抬下巴,對著桌對面的電腦說“查收一下郵件,有服務器密碼,去把數據分類統計一下。”
這是要讓她干活
好的。
有事做總比尷尬站著要好。
唐念麻利地走到電腦后,登上自己的郵箱,最新一條未讀郵件來自chenzanjuedu
任務是要她給一堆中醫藥材分類。
唐念根據提示登進服務器,數據是從74萬篇中醫古籍中采集出來的65萬種藥材,里面有很多別名、錯名、重復等干擾項,需要先刪除重復、冗余或噪聲數據,再人工標注并對數據進行歸類。
唐念以前做過機器學習方面的比賽,懂得歸類問題的基本步驟,一般先是建立詞匯表,獲取每個詞的ebeddg,然后使用n進行特征提取,最后挑選算法做二分類。
唐念憑借多年工作形成的肌肉記憶,搭建了個算法框架,把65萬條數據灌進去,結果出來后拿著對照組驗證準確度。
陳知禮從辦公桌前走出,走到她身后,只掃一眼得出結論“過擬合了,重測。”
“”
唐念只好刪掉記錄,又重新跑了一遍,陳知禮看一眼,仍不滿意“我說的重測是讓你換一種算法,不是讓你拿著3000萬美金的gu在這磨時間,消耗性能,ok”
“”
那你一開始說清楚啊
“還有,你樣本選的有問題,sote得到的增強樣本有誤差,可能已經偏離了原來的語義,大概是文本ebeddg后距離向量處于高維空間,需要映射到低維再處理。”
唐念沒聽懂,一臉茫然地看著他。
“看我干什么,數據增強不會做就去查資料,瞪著一雙大眼只會喘氣嗎”
他的火氣太明顯,唐念懂了,他根本就不是讓她來干活的,尋個理由拿她撒氣罷了,所以無論她做什么都不可能令他滿意。
“你說話就說話,大聲吼什么,我怕狗叫”
她最近根本沒得罪他,上課不遲到,文獻也好好翻譯完了,都不知道他在這發的什么神經。
當然,犯病是不需要理由的。
陳知禮目光忽然移過來,唐念也看著他,四目相對,誰也不服誰。