6大AI研究!AI可取代第三年放射科住院醫師?AI模型在不同醫院中的準確率不同?

2020/11/13
6大AI研究!AI可取代第三年放射科住院醫師?AI模型在不同醫院中的準確率不同?
人工智慧具有改善醫療系統的潛力,包括提高工作流程效率、預測健康風險、以及加速診斷速度等,以下整理近期6大重要AI研究,如AI判讀胸部X光可超越第三年放射科住院醫師(R3)、敏感度達92.9%的AI輔助
編譯/李林璦

人工智慧具有改善醫療系統的潛力,包括提高工作流程效率、預測健康風險、以及加速診斷速度等,以下整理近期6大重要AI研究,如AI判讀胸部X光可超越第三年放射科住院醫師(R3)、敏感度達92.9%的AI輔助辨識CT中外傷性肋骨骨折等,都可看出在AI輔助下,未來醫師可以更快、更準確地進行診斷。
 
但同時,也有研究指出,同一套AI模型在不同醫院中的準確率具有差異,相信也是AI在落地臨床上的一大挑戰。
 
1.AI判讀胸部X光可超越第三年放射科住院醫師
 
研究比較5位第三年住院醫師與AI演算法針對胸部X光檢查的判讀,該AI演算法是使用急診室中34萬2126張仰臥正面前後照的胸部X光進行訓練,涵蓋72項以上胸部X光片檢查結果。
 
結果顯示,AI演算法與放射科住院醫師判讀之間,在敏感性(sensitivity)上無統計學差異,但是AI演算法在特異性(specificity)、陽性預測值(positive predictive value, PPV)上高於住院醫師。
 
研究指出,AI演算法在胸部X光判讀上,可能可以達到或甚至超越第三年放射科住院醫師。雖然目前醫師判讀較複雜的案例優於AI演算法,但研究人員認為這與訓練AI演算法的數據量有關。該研究於10月9日發表於《JAMA Network》。
 
2. 機器學習開發不孕症動態診斷分級系統 穩定性達95%
 
這項研究運用6萬648對接受體外受精和胚胎移植夫妻的健康記錄,建立了一套不孕症動態診斷和分級系統,整體檢測穩定性可達95.94%。該研究於11月9日發表於《JAMA Network》。
 
根據最終是否懷孕的結果,將患者分為妊娠組(15021名)和非妊娠組(45627名),透過兩組間顯著性差異的檢驗結果和臨床醫生的看法,建構了7項指標,包含:年齡、身體質量指數(BMI)、濾泡刺激激素(FSH)濃度、竇卵泡數(AFC)、抗穆氏管激素(AMH)、卵母細胞數量、子宮內膜厚度,7項指標依不同權重,將不孕症患者的狀況從A-E,劃分為5個等級。E級代表懷孕機率僅有0.90%,A級懷孕機率為53.82%。
 
3.機器學習AI臨床醫師和癌末患者的對話(Serious illness conversations, SICs)  並影響患者死亡率
 
臨床醫師如何與重症患者溝通十分重要,關乎預後、治療目標和臨終的選擇,增加該溝通可改善臨終護理和患者預後,研究人員發現,在1萬4607名癌症患者的隨機分組臨床試驗中,該研究利用AI介入可以增加醫師與重症患者的交談率,從1%顯著增加到5%,也增加了預測180天內的死亡風險機率,從4%顯著增加到15%。該研究10月15日發表於《JAMA Oncology》。
 
4.急性腎損傷AI預測模型 不同醫院準確度差異大
 
該研究利用美國PCORnet平台開發急性腎損傷(AKI)預測模型,並研究了在六家不同的醫療機構中,同樣的模型是否適用,結果顯示,跨機構應用會造成模型預測性能下降,研究人員認為,這是由於不同醫院的人群不同,異質性(heterogeneous)高。
 
因此,無論原本醫院訓練的AI模型多準確,是否應用能在別的醫院,都還是一個需要研究的課題。該研究11月9日發表於《Nature communications》。
 
5.深度學習開發出5基因分類敗血症患者 死亡率、治療預後大不同
 
敗血症是一種較具異質性的疾病,不同亞型的敗血症的差異很大,個人化的治療策略是關鍵,而全基因表現圖譜分析已被用於鑑定敗血症的次分類,但由於分類不固定與缺乏外部驗證,難以有可靠的預測AI模型。
 
因此,該研究運用基因表現資料庫(GEO)和ArrayExpress數據庫中,選取1213名敗血症患者的全基因表現圖譜,運用5個基因(C14orf159、AKNA、PILRA、STOM和USP4)作為分類標準,發現第一類型敗血症患者與免疫抑制有關,其死亡率高於第二類型敗血症患者,且兩類型的敗血症患者對於類固醇藥物─hydrocortisone治療的反應也不同。該研究11月10日發表於《EBioMedicine》。
 
6. AI輔助辨識CT中外傷性肋骨骨折 敏感度達92.9%
 
肋骨骨折是創傷嚴重程度評估的關鍵因素,而準確、大量地從電腦斷層掃描(CT)圖像中診斷出肋骨骨折十分艱鉅,同時也取決於放射科醫師的經驗。
 
因此該研究以名為FracNet深度學習技術,開發出AI輔助辨識外傷性肋骨骨折系統,運用了有900名患者7473張有標註的外傷性肋骨骨折CT圖像的RibFrac數據庫進行模型訓練,檢測敏感度高達92.9%,每次CT掃描有5.27個假陽性,比放射科醫師診斷的誤報率低很多。該研究11月10日發表於《EBioMedicine》。
 
參考資料:https://www.beckershospitalreview.com/artificial-intelligence/6-recent-studies-exploring-ai-in-healthcare-2.html