《Nature》AI大規模研究:血液中微生物DNA可望用於癌症檢測

2020/04/13
《Nature》AI大規模研究:血液中微生物DNA可望用於癌症檢測
3月11日,由美國加州大學聖地牙哥分校(UCSD) 研究團隊利用線上癌症基因體圖譜(TCGA)資料庫,執行首次以AI分析血液中微生物DNA/RNA序列,來鑑別癌症的大規模系統性研究。

《Nature》AI大規模研究:血液中微生物DNA可望用於癌症檢測 (圖片來源: 網路)

2020.04.13 環球生技雜誌 / 記者 吳培安 編譯

3月11日,由美國加州大學聖地牙哥分校(UCSD) Gregory D. Poore、Rob Knight等人利用線上癌症基因體圖譜(TCGA)資料庫,執行首次以AI分析血液中微生物DNA/RNA序列,來鑑別癌症的大規模系統性研究。結果顯示,透過檢驗微生物序列可以有效分辨出癌症種類,具有成為癌症液態活檢(liquid biopsy)臨床應用的潛力。

研究團隊分析了TCGA線上資料庫中,共計33種癌症、來自近1萬名患者、超過1.7萬份樣本的資訊,包括來自腫瘤(原發腫瘤、復發腫瘤、轉移腫瘤)、鄰近正常組織和血液中,樣本所含有的DNA和RNA序列,並利用獨立訓練的人工智慧(AI)等運算模組,過濾掉研究團隊所認為的污染序列,並針對大量的序列資料進行標準化(normalize)和分類工作。

研究團隊表示,在經過嚴格過濾程序,去除潛在污染或其他變因後,共計有6.4兆筆序列資料,其中7.2%被歸類為非人類序列;其中將近1/3是細菌、古菌或病毒,12.6%可以鑑定到屬(genus)的層級。

接著,研究團隊又利用這些資料進行機器學習(machine learning),讓演算法學習分辨不同種類的腫瘤、分辨不同時期的同種癌症,以及正常組織和腫瘤的差異。

研究團隊表示,整體而言這個運算模組在辨明腫瘤種類、腫瘤組織和正常組織都表現良好;此外,研究團隊也發現不同種類的癌症,其關聯到的微生物種類差別也很大。例如細梭菌(Fusobacterium)和腸胃道腫瘤相關,而乳頭瘤病毒(Alphapapillomavirus)或肝炎病毒(Hepacivirus),則與子宮頸癌、頭頸癌和肝癌相關。

不過,研究團隊也表示,這套運算模組在分辨在不同時期的同一癌種上表現並不好,僅在大腸直腸癌、胃腺癌和腎透明細胞癌中區分I期和IV腫瘤,但對其他腫瘤類型的分辨度都不佳。

此外,研究團隊也利用AI分析了TCGA中血液樣本的全基因體序列。結果發現,利用血液中的微生物DNA(microbial DNA, mbDNA)進行癌種分類的表現也同樣良好,且對於透過血液中游離DNA無法檢測的Ia到IIc期腫瘤,也能透過mbDNA辨識出來。

在分辨無罹癌者和罹癌者的測試中,AI模組成功識別出89.8%的前列腺患者、88%的肺癌患者、80%的黑色素瘤患者,其整體正確診斷率約為71%。

研究團隊認為,這項將AI分辨微生物、應用在癌症變化診斷的方式,有機會成為新的治療或診斷途徑。

不過,這項方法還有許多限制需要突破,例如樣品採集時可能會無法避開微生物或外來mbDNA的汙染,過度的排除也可能會將存在於腫瘤中的微生物標記漏失;無法確定癌症發生時,微生物是位於腫瘤內、免疫細胞內、還是周圍組織內;這些微生物是促進癌症發展、對抗癌症,或僅僅只是剛好存在於腫瘤環境中的「過客」,都還需要進一步的研究改善。

 

參考資料:

https://www.nature.com/articles/d41586-020-00637-w