生物資訊X定序科技 臺灣10年積累邁向基因體新視野

2020/12/25
生物資訊X定序科技 臺灣10年積累邁向基因體新視野
近日,專注在生物資訊學分析與生物技術開發的康健基因,於公司成立十周年之際,主辦生物資訊研討會和工作坊,邀請中研院李文雄院士、國內生物資訊尖端研究學者,以及英國「牛津奈米孔科技公司」(Oxford Na
 報導/彭梓涵

近日,專注在生物資訊學分析與生物技術開發的康健基因,於公司成立十周年之際,主辦生物資訊研討會和工作坊,邀請中研院李文雄院士、國內生物資訊尖端研究學者,以及英國「牛津奈米孔科技公司」(Oxford Nanopore Technologies)生物資訊產品經理、NVIDIA生資專家,分享如何善用高度擴展性的技術與策略,為基因體研究帶來新的視野。

中研院李文雄院士

  

研討會首先邀請分子生物學及演化領域極具貢獻的中研院李文雄院士擔任開場講者,並以「人工智慧建構基因調控網路」為題,分享其實驗室開發的預測轉錄因子結合位點(TFBS)的機器學習方法。

他表示,透過此方法與DNA親和純化定序(DAP-seq)技術結合,可以大規模確定TFBS,並可以建構基因調控網絡(A gene regulatory network, GRN)。

Oxford Nanopore Technologies生物資訊產品經理Stephen Rudd

   

康健基因是Oxford Nanopore Technologies在臺首家認證實驗室,至今已提供實驗及分析服務超過兩年,此次研討會中也特別請到Oxford Nanopore Technologies生物資訊產品經理Stephen Rudd以連線方式,分享奈米孔定序技術的原理、分析及應用。

Stephen Rudd表示,奈米孔定序技術的原理,是偵測DNA或RNA通過穿膜蛋白(transmembrane protein)中的奈米孔洞時,所造成的連續電流變化,藉此解讀序列,不像傳統核酸定序方式需經過序列放大步驟,因此定序速率更快、更精準。

而在此快速、精準的優勢下,可攜式/移動式的奈米孔定序設備,已在包括伊波拉病毒、茲卡病毒等多項傳染病發生地,證明了它們確實可用來作為現場監測工具。

中正大學資訊工程系黃耀廷教授

 

中正大學資訊工程系黃耀廷教授,則以「基因體組裝和錯誤校正演算法開發」為題演講。他首先表示,長片段定序是從頭定序(de novo sequencing)發展的一項重要技術,而基因組裝定序的品質很大程度上,取決於定序錯誤的校正,因此他也分享其開發的基因體組裝演算法,可特別用於目前使用率越來越高具有長片段定特質的「奈米孔定序 (Nanopore sequencing) 」。

長庚大學生物醫學系黃柏榕助理教授

  

長庚大學生物醫學系黃柏榕助理教授則分享「開發系列癌症基因體分析工具的經驗、困難、與解決策略」。他指出,癌症基因體學研究隨著近年高通量定序技術蓬勃發展而達到了快速推進,應用層面也逐漸擴展到跨體學整合。

黃柏榕也表示,生物資訊分析流程複雜,涉及檔案格式轉換、突變位點註釋、突變類別統計分析、癌症趨動基因搜尋、突變特徵解析等繁瑣步驟。此外,隨著基因變異檢測範圍擴大,數據量倍增,應適時的導入具高度擴展性的方法與策略,才能確保每個大數據分析步驟的流暢。

NVIDIA資深資料科學家劉冠良

 

隨著分析硬體的需求越來越大,康健基因也請到NVIDIA資深資料科學家劉冠良博士,分享GPU與AI 如何加速基因體分析以及應用,他表示透過加速計算和AI,讓使用者能夠高效率進行鹼基讀取,開發單細胞基因體分析及多種GATK(Genome Analysis Toolkits),從而支持了個人化醫學、癌症和藥物研究,以及COVID-19的研究發展。

台北醫學大學醫資所吳育瑋副教授

 

台北醫學大學醫資所吳育瑋副教授,則在研討會中分享如何透過泛基因體(pan-genome)序列的分析,探究特定細菌種類的功能分佈,並表徵對抗生素具抗藥性的微生物菌株;另外他也分享,如何將運用機器學習演算法透過泛基因體預測細菌抗藥性、以及建立基因網路預測未知基因的功能性。

政治大學資訊科學系張家銘助理教授

  

政治大學資訊科學系張家銘助理教授,則詳細介紹了演化樹的建立過程及其在COVID-19演化歷史上的應用,並說明如何利用循跡控制系統(TCS),找到多重序列比對(multiple sequence alignment,MSA)中最可靠部分。

此外,他也分享透過超多重序列比對(Super-MSA)以得到更多分析資訊,以及利用統計上的bootstrap數值,讓演化樹的結果有更高的支持度。

高雄大學資訊管理系楊子賢助理教授

 

高雄大學資訊管理系楊子賢助理教授,分享其團隊為了了解非小型編碼RNA(piRNA)與細胞mRNA轉錄物的結合機制,提出首個基於多頭注意力的深度學習架構,以計算piRNA結合靶標的能力。

目前團隊設計的「piRNA-mRNA binding」模型,其曲線下面積(AUC)可達86.2%的高辨別力。此外,該模型還有助於生物學中未知piRNA 結合力規則提供解讀。


中國醫藥大學老化醫學研究中心盧子喬博士

 

中國醫藥大學老化醫學研究中心盧子喬博士,則分享利用秀麗隱桿線蟲(Caenorhabditis elegans)模型,觀察到生殖細胞和腸道細胞中有更多的飢餓反應基因,該結果證明這兩種細胞類型是對食物匱乏做出反應的主要細胞類型。

他也進一步介紹其團隊建立的首個動物飲食反應性單核轉錄體,並確定了控制飢餓反應和細胞間訊息傳遞的調節者。

康健基因執行長吳夢楚

康健基因執行長吳夢楚博士於會議結尾也表示,臺灣的生物資訊學科從十幾年前開始起步,已培養和積累了一批優秀的生物資訊人才,康健亦不斷將生物資訊研發和人才作為公司發展的核心,持續推陳出新,配合公司提供的高通量基因體試驗平台,為臺灣科研界提供服務。

為了促進該領域的研究經驗互相交流,需要更多生物資訊的專家一起共襄盛舉,她也期望學術界能持續培養生物資訊人才,與產業能更緊密結合,讓生物資訊領域能有更好地發展。

後會舉辦的實作工作坊也邀請長庚大學人工智慧中心及台灣人工智慧實驗室 (AILabs)專家帶領參加者實際操作與演練資料分析的方法。