Azure高效能運算助力基因解碼 加速生醫研究

Azure高效能運算助力基因解碼 加速生醫研究

COVID-19 疫情肆虐全球,全球醫生和護理師都站上第一線,對抗病毒傳染,保護民眾健康,但另一個看不見的戰場,世界各國的研究者也努力地透過人類基因和病毒樣態分析,解碼病毒致病、死亡和用藥的原因。然而,日趨龐大的基因資料常讓計算時間呈指數型增長,新一代的基因研究需要更強大的運算資源協助。有鑑於此,台灣微軟攜手臺大智慧醫療中心及公衛學院團隊,透過公有雲的高速算力,利用英國人體生物資料庫(UK Biobank),嘗試找到基因與病毒感染的關聯性,同時提高台灣醫學研究能量,為這個全球性的人類世紀挑戰提供解方!

2020 年歐美疫情延燒之際,台灣政府與民間發動「Taiwan Can Help」捐贈,提供許多口罩、防護衣等醫療物資給有需要的國家,獲得了許多國際肯定。在科研領域,由於台灣第一時間邊境控管得宜,僅有零星的 COVID-19 確診案例,缺乏有效的數據可以投入對病毒的解析。為了在這場重要戰役上貢獻心力,臺大醫院以及國內相關學研單位,紛紛向全世界最大的英國人體生物資料庫提出資料的授權使用申請,希望透過基因分析的方式,從不同角度來了解新冠病毒。

台大醫院智慧醫療中心副主任李建璋教授表示,在實體的臨床醫療之外,UK Biobank 還記錄了所有醫療活動、影像及電子病歷。英國COVID-19 疫情嚴重,UK Biobank 五十萬人的完整的資料讓他們迅速可以組成資料科學國家隊,PCR 檢測的結果同步串聯到 Biobank 資料庫,並公開給全世界學者一起來研究對抗病毒。UK Biobank 擁有 COVID-19、基因、臨床表現等數據,他們還結合英國各醫院的電子病歷,讓研究者能夠對 COVID 的影響建立各種預測模型來協助防疫,堪稱是目前全世界最進步、最完整的生物資料庫。

然而當李建璋教授的研究團隊想要下載 UK Biobank 資料時,因數據量過於龐大,地端的電腦不只速度非常慢,還出現因下載時間過長而當機的情況。得知微軟總部 AI for Health 計畫針對全球疫情挑戰,向全球學研人員廣發提案邀請,提供總額高達 1.1 億美金的 Azure 雲端高速算力的贊助方案時,李建璋教授和台大醫院公衛學院公衛學系的盧子彬副教授,趕在徵案截止前夕,向微軟總部提交了申請,並且很幸運地獲選,自 2020 年秋天起,得以開展基因統計學領域與資訊工程的跨界合作,在研究室裡一起對抗病毒。

李建璋教授研究的目標,是針對 COVID-19 易感性,透過 UK Biobank 的基因及大數據分析,來預測確診病人的死亡機率。他的團隊利用多基因風險計分進行研究,在一年多的努力後,初步結果顯示基因能解釋 60% 新冠肺炎死亡率,顯著基因主要在第三、第九對染色體;若再加上年紀、性別更可解釋八成死亡率。

李建璋教授表示,做基因定序或利用病歷大數據,案例數量不夠研究就不準確,但面對 UK Biobank 有 50 萬人人體樣本數、每人 9600 萬個基因型的巨大資料庫,傳統在實驗室的筆電規格很難跑得動。幸虧微軟 Azure High Performance Computing 高效能運算提供超級計算力,才讓研究得以順利進行。

台大公衛學院盧子彬副教授則從病毒基因定序,試圖解開病毒和突變的密碼。他表示,目前做微生物基因變化最主流的 Shotgun(獵槍式)分析法,遠比對人類分析還複雜,因為人類基因拼圖盒子對著基因圖譜就可以拼出人類,但面對成千上種細菌的資料如同有成百上千個拼圖盒子,可能是新冠肺炎、肺結核菌或大腸桿菌,分析操作的難度更加複雜。盧子彬副教授的團隊提供了一個伺服器伺服器,讓大家在網路上上傳在地的基因數據,來分析基因變異資料與細菌的關聯。

不過,盧教授也指出,他在研究室裡進行細菌的組裝,一個樣本要花 27.7 小時,做基因分析要花 52 小時,如果要做 1000 個甚至幾十萬個樣本,單靠研究室的伺服器,不但耗費龐大,而且電腦會逐漸變老舊,功能不足,趕不上研究需求。他認為利用 Azure 提供的巨型運算資源來操作,可以大幅推進研究的進程!

盧教授表示,Azure 可以自行選擇使用主機機型,Windows 或 Linux 等程式,在應用軟體上也有多樣選擇。使用運算伺服器時,因為微軟在全球和各地區都有資料中心,所以一個帳號就可以不必與別人排隊使用主機,隨時有個主機專屬供你使用。

台大流行病學與預防醫學研究所郭柏秀副所長則感慨,多年來投入心理失調與基因研究,無論是基因和影像資料整理成為可用的數據,在傳統研究室跑電腦,她拿到的數據量就要花五年,僅僅是整理資料的時間,博士生都可以畢業了,如果不求助高運算系統,這類研究就無法進行。利用 Azure 系統做研究除了不必自行購設備,可在雲端高速儲存、傳輸、運算外,郭教授特別強調雲端儲存的安全性。她舉例,曾有研究生跑電腦資料,主機長時間運作發熱起火,不但設備全沒了,連所有的研究資料都付諸一炬,真是欲哭無淚。如果使用雲端就會有備份,研究安全性也得以確保。

隔行如隔山,基因科學和資訊工程都是頂尖的科技,做基因研究學者無法精通電腦機器機種和程式版本,當研究碰到電腦上的問題,等於有微軟頂尖的電腦科技團隊參與協助。Azure 不僅僅提供雲端服務,更提供系統的解決方案,有世界最好的資訊工程團隊協助,這是如虎添翼、強強聯手,對研究的進行有意想不到的助益。此外,Azure 平台上有世界不同研究團隊一起在做不同研究主題,有時也能彼此交換意見,了解相關領域最新進展,激發創意。最重要的是,透過 Azure 高效能運算平台,不僅經濟有效地提升基因運算效能,極大化基因資料庫的價值,更符合醫療攜手科技的趨勢,使基因研究和精準醫療又向前邁進一大步。

想更了解多基因風險評分及 Azure 加速研究進程,歡迎收看:https://youtu.be/RG6f3rZwI9k




想更了解基因插補、疾病與人類行為基因研究,歡迎收看:https://youtu.be/vZ6-S-y7gxI

 

Microsoft

熱門新聞

Advertisement