Meta透過開發MultiRay平臺來最佳化人工智慧模型運作,降低整體的模型運算成本。這個平臺的想法,是要集中化大型模型的使用,以共同分擔大部分的處理成本,除了能夠有效降低成本之外,可以獲得的模型服務,也比公司內各團隊自己發展的模型更大更好。

現在人工智慧可以處理文字、圖像和各種形式的內容,但要產生高品質的結果,那就需要以非常多的資料訓練大型模型,但Meta表示,這個過程代價高昂,當有許多問題要解決,就需要產生非常多的大型模型,如此成本便會迅速失控。也就是說,事實上在生產環境中使用的模型,通常更小且更簡單。

而MultiRay平臺便要透過重複使用,模型運算成本最昂貴的嵌入(Embedding),來最佳化人工智慧模型的訓練和託管成本。將整個企業的運算整合到單個模型中,更簡單地使用人工智慧加速器,並且以公司層級來權衡運算和儲存能力。MultiRay的通用模型經過訓練,可以廣泛應用在各種任務中,研究人員提到,這種通用模型比之前針對每個任務建立的小型模型表現更好。

藉由使用MultiRay,使得所有Meta的團隊,都可以更快改進和迭代應用程式的機器學習模型,從貼文主題標記到仇恨言論偵測,比起每個團隊從頭開始建構的大型端到端模型,MultiRay能夠以更高的效率和更少的人力完成任務。

MultiRay的第一個投入生產的模型是TextRay,支援文字理解應用,偵測虛假內容並改善用戶的搜尋體驗。但只有理解文字是不夠的,因為貼文可能包含文字、圖像和影片,要理解一篇文章,系統需要分析每個元素,並且綜合元素進行整合性分析。

因此MultiRay的第二個模型PostRay,是將文字和圖像理解整合到同一個模型中,其應用的範圍很廣,包括臉書和Instagram上包含文字和圖像的資料,這包含用於Reels的主題分類。由於PostRay模型結合多個領域的研究,因此訓練、部署和維護也更複雜,透過MultiRay能夠將所有服務整合使用同一個通用模型,不只減省成本也能夠使應用更快投入生產。

熱門新聞

Advertisement