“這是mbir算法核心參數啊!”
晚上10點,沈月緊急召開公司線上會議,讓研究院專家看網盤資料。
研究院有ai算法團隊,幾位資深工程師很快做出判斷:
“看上去,正好是攻堅課題需要的。”
“用于大模型ir算法。”
“先做了小樣本集訓練,得到一組效果最優的參數。”
“有這組參數,可以做大范圍訓練,得到重建算法需要的大模型!”
“跑完訓練再用模型檢驗,做低劑量ct能達到什么重建效果。”
有人問參數是從哪里來的,沈月說是跟ge私下買的,具體不能透露。
這是跟王霽商量的口徑。
秘密必須控制在蕭家范圍內。
從文件內容可以看出,曹海確實有了突破進展,接下來,蕭氏醫療需要繼承他的遺志,訓練出模型并檢驗成果。
沈月問團隊:“需要多少算力資源?多久能訓練完?”
研究院主任回答:“最好有3千張卡,按匯總數據量估計,跑2個月吧。”
為打贏專項攻堅戰,衛健委做了大量協調,各醫院都提供了數據。
訓練集不是問題,難的是算法。
以及算力資源。
畢竟蕭氏醫療不是大模型公司,沒有這么多gpu卡。
主任本想開口要1萬張,怕被罵獅子大開口,最終打了個3折。
其實,3千張也是搞不到的。
別說3千張,1千張都沒有……
沈月沉吟片刻,搖搖頭:
“卡我來弄,你們要趕時間!”
“第一次專項匯報是9月15號,算周末只有8天時間。”
“咱們只有一組參數,還不確定效果如何,這樣沒法匯報……”
“我聽說智愈醫療已經有完整方案,準備開始訓練了!”
“他們有來自西門子的專家,在立項投入、團隊資質方面都占優,肯定會宣布一個激進的項目計劃,博取認可。”
“三家競爭企業里,咱們處于下風,首次匯報必須有說服力!”
研究院專家們都低著頭,聽說只有8天時間,沒人敢吭聲。
王霽對沈月道:
“時間太緊,3千張卡算力很難搞到。”
“即便能從各處協調到卡,還需要匯集到一個機房。”
“從來源地結束任務、下架拔卡、物流、協調上架,半個月就過去了。”
“騰云也沒有這個規模的機房,而且算力都租出去了。”
“我可以從其他地方找機房,1千張ok,但3千張夠嗆。”
ai訓練還沒法做到去中心化,得在一個機房訓練,否則數據傳輸的帶寬是巨大開銷,而且延遲高、任務不穩定。
想要8天解決,不止是訓練量,連算力也很難找到。
這時,研究院一位工程師開口:
“除非……”
“能再優化算法,減少算力需求。”
“咱們用的是開源mbir算法,也許存在優化的空間。”
“但我們以使用為主,對里邊的原理,沒有人特別精通……”
“如果能找個大牛過一遍算法,沒準可以找出優化點。”
“只要優化2/3執行效率,1千張卡就能當3千張用了。”
沈月嘆了口氣:“咱們以前沒積累過這方面專家,哪有現成大牛用?”
算力、時間都是問題,她心氣一下低落不少。
如果3千張卡需要2個月,1千張卡至少要……
半年!
這意味著,幾個匯報節點毫無產出。
跟對手差距越來越遠,基本沒戲了。
王霽忽然開口:“別擔心,算力和算法優化,我來解決。”
蕭恒、沈月臉上滿是感激和欣慰,小雪見男朋友為她家的事這么上心,立刻又興奮起來,忙問:“你有辦法?”
王霽笑道:“我認識些精通算法的人,我試試看,應該有戲。”
事實上,他樂觀了一點點。