圖片來源: 

DeepMind

Alphabet旗下專門研究人工智慧的子公司DeepMind於本周宣布,已與歐洲生物資訊研究所(EMBL-EBI)合作,將AlphaFold DB中的蛋白質預測結構數量,從100萬擴充到2億,幾乎涵蓋了所有科學上已知的蛋白質,這同時也意味著全球主要的蛋白質資料庫UniProt的絕大多數頁面上,都會出現預測結構。

DeepMind所建置的AlphaFold是個可用來預測蛋白質結構的AI模型,2020年時,AlphaFold 2的準確度中位數達到92.4,就算是在最難的自由建模類別的蛋白質項目中,AlphaFold 2的準確度中位數亦達87。DeepMind在2021年7月開源AlphaFold,並建立了供外界免費存取的蛋白質預測結構資料庫AlphaFold DB。

蛋白質為地球生物必要的組成份子,但其功能取決於它的3D結構,得知蛋白質結構就能進一步地理解它的功用與原理,AlphaFold即提供了預測蛋白質結構的解決方案。

根據DeepMind的統計,自去年7月以來,全球已有超過50萬的研究人員存取AlphaFold DB,以加速研究真實世界中待解決的各種問題,從塑膠污染到抗生素的耐藥性等;此外,在《Nature》期刊上發表的AlphaFold論文,已被引用超過4,000次;開放的結構也被整合至各種公開的資料集中,包括Ensembl、UniProt與OpenTargets。

最新的AlphaFold DB所擴編的蛋白質預測結構涵蓋了植物、細菌、動物與其它有機體,規模為最初資料庫的200倍,科學家可直接透過Google Cloud Public Datasets下載,也能在蛋白質資料庫UniProt中看到新的預測結構。

迄今DeepMind已看到全球的科學家將AlphaFold的成果應用在了解疾病、保護蜜蜂、破解生物謎題到分解塑膠等,也希望更全面的AlphaFold DB可協助更多的科學家執行任務,或是開闢新的研究領域,例如環境蛋白質組(Metaproteomics)。

此外,DeepMind也將邁開腳步,把AI應用在其它有趣且重要的科學挑戰上,包括氣候科學、量子化學與核融合。

熱門新聞

Advertisement