Meta開發MultiRay平臺最佳化大型AI模型訓練、使用成本

Meta透過開發MultiRay平臺來最佳化人工智慧模型運作，降低整體的模型運算成本。這個平臺的想法，是要集中化大型模型的使用，以共同分擔大部分的處理成本，除了能夠有效降低成本之外，可以獲得的模型服務，也比公司內各團隊自己發展的模型更大更好。

現在人工智慧可以處理文字、圖像和各種形式的內容，但要產生高品質的結果，那就需要以非常多的資料訓練大型模型，但Meta表示，這個過程代價高昂，當有許多問題要解決，就需要產生非常多的大型模型，如此成本便會迅速失控。也就是說，事實上在生產環境中使用的模型，通常更小且更簡單。

而MultiRay平臺便要透過重複使用，模型運算成本最昂貴的嵌入（Embedding），來最佳化人工智慧模型的訓練和託管成本。將整個企業的運算整合到單個模型中，更簡單地使用人工智慧加速器，並且以公司層級來權衡運算和儲存能力。MultiRay的通用模型經過訓練，可以廣泛應用在各種任務中，研究人員提到，這種通用模型比之前針對每個任務建立的小型模型表現更好。

藉由使用MultiRay，使得所有Meta的團隊，都可以更快改進和迭代應用程式的機器學習模型，從貼文主題標記到仇恨言論偵測，比起每個團隊從頭開始建構的大型端到端模型，MultiRay能夠以更高的效率和更少的人力完成任務。

MultiRay的第一個投入生產的模型是TextRay，支援文字理解應用，偵測虛假內容並改善用戶的搜尋體驗。但只有理解文字是不夠的，因為貼文可能包含文字、圖像和影片，要理解一篇文章，系統需要分析每個元素，並且綜合元素進行整合性分析。

因此MultiRay的第二個模型PostRay，是將文字和圖像理解整合到同一個模型中，其應用的範圍很廣，包括臉書和Instagram上包含文字和圖像的資料，這包含用於Reels的主題分類。由於PostRay模型結合多個領域的研究，因此訓練、部署和維護也更複雜，透過MultiRay能夠將所有服務整合使用同一個通用模型，不只減省成本也能夠使應用更快投入生產。

熱門新聞