林強接受了一整套的身體檢查,檢查內容甚至包括了全身CT掃描和mNGS測序。檢查價格高昂,耗時也頗久。但對于一個4U機箱里滿滿當當塞進去八張TESLAV100加速卡的實驗組來說,這部分的花費其實并不算難以承受。
嚴格來說,林強是老東西第一次進行實際操作實驗的對象。雖然組內的研究員們對于是否有必要第一次實驗就把老東西應用在這種疑難雜癥上有些意見不太統一,但既然已經決定了,那大家還是希望全力以赴,盡量為老東西搜集到更多的資料。
資料越多,老東西能做出的診斷理論上就會越精確。
要想知道他們的AI算法設計到底有沒有問題,光憑提前得出答案的那些病例報告肯定是不夠的——在人工總結記錄病例的時候,人們總是會不自覺地去除一些不夠“直接”的數據,以保證報告本身的簡單易讀。
而這些用來保證其他人順暢的處理方法,事實上給老東西省了不少麻煩——人體癥狀表現實在是太多了點,能否排除這些多余變量,準確找到病因,這才是老東西目前需要面臨的最大考驗。
而讓這群實驗人員感覺抓狂的是,哪怕他們盡心盡力,想盡一切辦法給老東西搞來了所有的資料,他們卻不能馬上驗證老東西的計算是否正確——沒有人知道林強到底得了什么病,就連吳友謙院長和三軍醫大的專家們得出的診斷結論也有著相當的模糊空間。
AI設計人員和運行管理人員不是醫生,他們是標準的理科生。計算結果要么是明確的A或者B,要么是在某些明確范圍內有多個結果。結果現在可好,計算出來的答案和標準答案對不上。要是完全對不上也就算了,那至少有個明確的“你們做錯了,需要重新檢查流程”的信號。有明確的結果,但是參考答案卻模糊不清——這還怎么做參考?
吳友謙看著面前一臉急色的眾多運營人員,渾不在意的擺了擺手,“看看你們這個樣子,太沒城府了。”他笑瞇瞇的喝了一口茶水,“醫生在臨床上遇到診斷不明的患者,也要用些手段排除一下才行。你們這就像是要求醫生第一個念頭就得正中靶心,找到疾病問題一樣。別說他孫立恩了,你找哪個醫生來都做不到。老東西這才修正了一年不到,正確率不是已經快趕上他了?”
“孫醫生的誤診率太低了,要不是每個診斷都有視頻作證,我肯定要懷疑他是做了弊的。”帶頭的實驗員員擦了一把臉上的汗,“他的平均誤診率還不到18%,急診相關的診斷誤診率才10%左右。老東西現在的平均誤診率在25%。要不是孫醫生婦科和產科誤診率比較高,那可真就成了妖怪了。”
“老東西的設計方向就是‘醫生臨床診斷的參考’,它一開始的設計就不是為了代替醫生。”吳友謙看著面前神色不一的研究員們,笑瞇瞇的解釋道,“我能理解你們這個想要把自己的成果完善到盡善盡美地步的想法,但是搞科研也要尊重客觀事實——無論你們怎么努力,治療和診斷這始終是醫生的專業工作。想要替代他們是不可能的,能夠把一個它做成一個好用的,可以依賴的工具,這就是你們現階段的工作。”
誤診率這個話題雖然很多從業人員都不愿提起,但必須承認的是,國內外的醫療活動中,誤診現象普遍存在。拋去需要被轉交司法部門處理的故意誤診不談,醫生們平均的誤診率大約在30%左右。這些誤診可能是由于疾病的不同表現特征,不典型表現,或者醫生們經驗不足,甚至患者隱瞞病史,導致診斷依據信息出錯等等。