Nvidia發布多項大型語言模型(LLM)新服務與框架,除了能夠自定義模型的服務NeMo LLM,以及擴展大型語言模型在製藥和生物技術產業的科學用服務BioNeMo,同時Nvidia也推出NeMo Megatron端到端框架公開測試版,供開發人員訓練和部署大型語言模型。

NeMo LLM服務讓用戶能夠方便地利用Nvidia託管雲端API,或是在公有雲和私有雲,大規模自定義和部署大型語言模型,無論是由Nvidia還是社群建置的基礎模型,都能藉由該服務的即時學習功能進行自定義。Nvidia將會透過NeMo LLM服務對外開放Megatron 530B模型,該模型是基於GPT-3架構,擁有5.3兆個參數的超大型模型。

官方提到,NeMo LLM是一種計算效率很高的服務,能夠將脈絡嵌入到用戶查詢中,使得特定案例能夠實現更高的準確性,只要數百個樣本就能夠獲得高精準度。開發人員可以將NeMo LLM服務用於建構特定領域和用例的應用程式,像是文本摘要、釋義甚至是故事生成等。

而Nvidia同時也發布NeMo Megatron端到端框架,可用來訓練和部署數兆參數的大型語言模型,NeMo Megatron現在於Azure、AWS、甲骨文雲端上提供公開測試板。官方解釋,NeMo Megatron提供一種簡單且高效的建構和部署大型語言模型方法,由自動化分散式資料處理的端到端工作流程組成,可用來訓練大規模自定義的GPT-3、T5和多語言T5模型,以及部署大規模推理模型。

NeMo Megatron的超參數工具能夠供用戶自定義模組開發,在特定的分散式GPU叢集配置上,自動搜尋訓練和推理的最佳參數配置。其使用張量、資料、工作管線平行化以及序列平行化等技術,達到高效能訓練,同時搭配高快速學習技術,使用戶能夠以最少的資料進行自定義,大幅改進效能和少樣本任務。

另一個Nvidia發布的BioNeMo服務,便是以NeMo Megatron為基礎建置,提供針對人工智慧藥物探索工作流程的統一雲端環境。現在科學家已經能夠運用人工智慧探索藥物,發明新的治療方法,同時了解這些藥物的特性、結構和功能。

而BioNeMo服務支援先進的化學和蛋白質組學Transformer模型,支援OpenFold方便擴展預測蛋白質結構工作流程,該平臺支援端到端模組化藥物探索工作流程,能夠加速研究,使科學家更好地了解蛋白質、基因和各種分子。

熱門新聞

Advertisement