圖片來源: 

Profluent、Salesforce研究院和UCSF的科學家,以類似生成文字人工智慧的方法,使用模型ProGen設計百萬種蛋白質,並且成功找出具有殺菌效果的蛋白質。這個研究實際應用人工智慧設計蛋白質,並經測試和證明其具有特定效果,也就是説,同樣的方法將能夠被用於加速新藥製造。

這項研究使用一個由Salesforce研究院所開發的ProGen模型,該模型能夠預測人造蛋白質的氨基酸序列。ProGen的運作方式和生成文字的人工智慧相似,研究人員將來自19,000個家族的2.8億種蛋白質的氨基酸序列輸入到模型中,並添加蛋白質特性控制標籤,經過數周的訓練,ProGen便學會生成新蛋白質的方法。

研究人員使用5個溶菌酶家族的56,000個氨基酸序列,以及有關這些蛋白質的上下文資訊微調ProGen後,該模型迅速產生一百萬個氨基酸序列,研究人員根據與天然蛋白質序列相似程度,和潛在氨基酸語法和語義的自然程度,篩選出100個序列並在細胞中實驗進行實驗,其中有66個和蛋白、唾液裡的溶菌酶一樣,能夠殺死細菌。

研究人員篩選這66個氨基酸序列,製作出5種活性最強的人工酶,將這些酶添加到大腸桿菌樣本中,並且和溶菌酶HEWL相比較,發現其中兩種人工酶,能夠以和HEWL相當的活性分解細菌細胞壁,而這兩個人工酶序列僅有18%的相似程度,和已知蛋白質序列的相似度各別為90%和70%。

天然蛋白質的功能很大程度受組成影響,只要有一個突變就會使蛋白質失去作用,而在另外一輪的篩選中,研究人員找出一個只與天然蛋白質序列有31.4%相似的蛋白質,但是該蛋白質仍然具有活性。

要產生特定功能的蛋白質,不只是需要生成對的氨基酸序列,蛋白質更需要折疊成特定的三維結構,才能具有功能性,研究人員以X光來量測蛋白質形狀,發現人造蛋白質即便在氨基序列上,與現有蛋白質差異高達30%,但仍可以呈現與天然蛋白質相符的形狀。研究人員提到,他們現在仍不清楚人工智慧究竟如何在變更氨基酸序列的同時,仍產生正確的形狀。

這些人工智慧所生成的蛋白質要被用於藥物,還需要在實驗室中進行長時間的測試,但是研究人員提到,這種蛋白質設計方法比蛋白質設計技術定向演化(Directed Evolution)更強大,能夠加速所有用途的新蛋白質開發。

熱門新聞

Advertisement