圖片來源: 

Meta

不讓DeepMind專美於前,Meta AI本周釋出了多種用來預測蛋白質結構的模型,以及含有6.17億種總體基因體學(Metagenomic)蛋白質結構的資料庫ESM Metagenomic Atlas,並宣稱此為全球最大的高解析度蛋白質預測資料庫 ,是既有任何蛋白質結構資料庫的3倍,也是首個大規模覆蓋總體基因體學蛋白質的資料庫。

由基因編碼的蛋白質是複雜且動態的分子,也是生命的基礎,它讓人類能夠看見,可對抗病毒,也是驅動微生物與肌肉的馬達;總體基因體學則是自然科學的新領域,它利用基因定序來發現地球環境中的蛋白質,從土壤、深海或體內的微生物,儘管現今大家對其知之甚少,但卻可能幫助人類解開進化之謎,發現可能有助於治癒疾病、淨化環境或生產乾淨能源的蛋白質。

Meta AI的科學家們打造了新的蛋白質結構預測方法ESMFold,它利用大型語言模型ESM2的表徵,自蛋白質序列中生成準確的結構預測,其速度可達現有最先進蛋白質結構預測方法的60倍,不過,ESMFold的準確度並不如DeepMind所開發的AlphaFold。

《自然》(Nature》期刊引用了Meta AI蛋白質研究負責人Alexander Rives的說法指出,該團隊只用了兩周的時間,就利用ESMFold預測出超過6億種的蛋白質結構,而AlphaFold光是生產單一的蛋白質結構預測,可能就需要幾分鐘。

ESM Metagenomic Atlas將讓科學家們可搜尋及分析數十億種蛋白質的結構,協助研究人員辨識出之前從未被描繪的蛋白質結構,尋找遙遠的進化關係,以及發現可應用於醫學或其它領域的新蛋白質。

Meta AI已釋出ESM Metagenomic Atlas資料庫、所使用的各種模型、研究論文,以及可用來檢索特定蛋白質結構的API。

圖片來源/GitHub

熱門新聞

Advertisement