答辯教室——
苗苗扯了扯林書墨衣袖:“快看!教授回來了!不是……他怎么拿上東西又走了啊?他、他不是評委嗎?”
邵溫白簡單和幾位教授交代了兩句,便大步離開。
背影透著一股并不留戀的干脆。
很快,另一位教授站起來,抬手壓了壓現場逐漸變大的嘩然聲和議論聲——
“各位稍安勿躁。邵教授剛才臨時接到校方的其他安排,所以無法繼續擔任評委一職,接替他的教授正在趕來的路上,很快就到,還請大家保持安靜,耐心等待。”
大概過了十來分鐘,接替的教授才匆匆趕到。
答辯也正式開始。
第一個上臺的,就是蘇雨眠。
她點開ppt,笑著看向臺下:“各位老師,同學,上午好。我是生命科學院研三學生蘇雨眠,我的論文題目是《mosaic-tegration-and-knowledge-transfer-of-sgle-cell-ultiodal-data-with-midas》,即利用midas進行單細胞多模態數據的馬賽克整合和知識遷移,我將從以下四個方面進行具體講解……”
半小時后——
蘇雨眠:“……以上就是我畢業論文的全部內容,感謝傾聽。”
說完,后退半步,鞠躬。
現場如夢初醒,接著,雷鳴般的掌聲響起。
“天哪!女神也太牛了吧,她講的那些,我完全聽不懂。”
“已經很照顧我們了,全程都用中文。她這篇論文原稿是英文的。”
“聽不懂才正常,如果我們都聽懂了,那還能上nature-bioteology嗎?”
“雖然聽得不是很明白,但我還是想說,女神的邏輯流暢度和語言表達能力太強了!”
“接下來是不是提問環節?我已經嗅到評委席上飄來的硝煙味……”
第一個開口的是來自生命科學院的周士博周老,他曾主動向院方領導提出想帶蘇雨眠幾人,結果沒成。
雖有遺憾,不過他尊重幾個孩子的選擇。
甚至隱隱有種刮目相看的意味。
“不忘師恩”誰都會說,但真正落實到行動的,又有幾個?
歐陽沒看錯人,也沒等錯人。
蘇雨眠值得!
周士博:“既然大家都這么謙虛,那就由我來起這個頭,權當拋磚引玉。蘇同學,你剛才著重講了midas這種新算法的基礎邏輯,以及具體運行思路和前端操作方式,卻沒提這種新算法出現的意義和可能帶來的積極影響,可以大致說一說嗎?”
蘇雨眠:“眾所周知,單細胞測序技術是近年來生命科學領域的突破性技術,能夠檢測單個細胞內的多種遺傳物質與功能分子,比如rna表達、蛋白質豐度和染色質可及性等等,從而揭示細胞在不同分子層面的異質性以及組學之間的關聯,有助于更加深入地理解細胞功能,探索生命發育和疾病發生等機制。然而——”
她話鋒一轉,“隨著測序技術的發展和測序數據的增長,不同組學組合、不同測序技術、不同測序樣本的‘馬賽克’式單細胞數據整合成為巨大的挑戰。”
周士博點頭:“確實如此。”
蘇雨眠:“您問midas出現的意義,我認為這應該是人類研究首次實現通用單細胞多組學馬賽克數據的模態對齊、數據補全、批次校正等整合功能,為構建大規模多組學細胞圖譜、實現大規模單細胞多組學分析與知識遷移提供了重要的原創技術……”
接著,是化學與分子工程學院的民受文,民教授——
“這種新算法對比從前的方法,有什么突出優勢嗎?”
這個問題很大,很泛泛,屬于“萬精油式”提問,套用到其他論文上也沒毛病。
但蘇雨眠還是想了想,認真答道:
“midas假設每個細胞的多模態觀測值是通過深度神經網絡從兩個與模態無關且解耦的隱變量生成……其輸入由不同單細胞樣本(批次)的表達矩陣和批次編號向量組成……因此可能存在不同的技術噪聲、模態組合和觀測特征……midas的輸出包括生物狀態和技術噪聲兩種低維表示的矩陣,以及對缺失模態和特征進行了補全并消除了批次效應的表達矩陣。”