NVIDIA 透過企業級生成式人工智慧微服務為聊天機器人、Copilot和摘要工具帶來商業智慧

NVIDIA（NASDAQ：NVDA）今天宣布推出一款生成式人工智慧微服務，讓企業能夠將客製化大型語言模型與企業資料連結，從而為他們的人工智慧應用程式提供高度準確的回應。

NVIDIA NeMo™ Retriever 是 NVIDIA NeMo 系列框架和工具中的新產品，用於建置、客製化和部署生成式人工智慧模型，可協助組織透過企業級檢索增強生成（RAG）功能增強生成式人工智慧應用程式。

作為一個語意檢索微服務，NeMo Retriever 透過 NVIDIA 最佳化的演算法幫助生成式人工智慧應用程式提供更準確的回應。使用微服務的開發人員可以將其人工智慧應用程式連接到位於雲端和資料中心的業務資料。它將經過NVIDIA最佳化的檢索增強生成功能添加至人工智慧代工服務中，並且是 NVIDIA AI Enterprise 軟體平台的一部分，可在 AWS Marketplace 中獲得。

Cadence、Dropbox、SAP 和 ServiceNow 是與 NVIDIA 合作此項目的先驅，他們將生產就緒的檢索增強生成功能建置到其客製化生成人工智慧應用程式和服務中。

NVIDIA 創辦人暨執行長黃仁勳表示：「具有檢索增強生成功能的生成式人工智慧應用程式將是企業的下一個殺手級應用程式。透過NVIDIA NeMo Retriever，開發人員可以創建客製化的生成式人工智慧聊天機器人、副駕駛（copilot）和摘要工具，這些工具可以存取他們企業的資料，透過準確且有價值的生成式人工智慧的智慧來提高生產力。」

全球領導者使用 NeMo Retriever 提高型語言模型準確性

電子系統設計領導者 Cadence 為超大規模運算、5G 通訊、汽車、行動、航空航太、消費者和醫療保健市場的公司提供服務。它正在與 NVIDIA 合作開發檢索增強生成功能，用於工業電子設計中的生成式人工智慧應用。

Cadence 總裁暨執行長 Anirudh Devgan 表示：「生成式人工智慧引入了創新方法來滿足客戶需求，例如在設計過程早期發現潛在缺陷的工具。我們的研究人員正在與 NVIDIA 合作，使用 Retriever 進一步提高生成式人工智慧應用程式的準確性和相關性，以揭示問題並幫助客戶更快地將高品質的產品推向市場。」

破解準確的生成式人工智慧應用程式的程式碼

與開源檢索增強生成工具套件不同，NeMo Retriever 透過商業上可行的模型、API 穩定性、安全性修補程式和企業支援來支援生產就緒的生成式人工智慧。

NVIDIA最佳化的演算法為 Retriever 的嵌入模型提供了最高精度的結果。優化的嵌入模型捕捉單字之間的關係，使大型語言模型能夠處理和分析文字資料。

企業使用NeMo Retriever可以將其大型語言模型連接到多個資料來源和知識庫，使用者可以輕鬆地與資料互動，並使用簡單的對話提示獲得準確、及時的答案。使用Retriever驅動應用程式的企業可以讓使用者安全地獲取跨多種資料模式的訊息，例如文字、PDF、圖像和影片。

企業能夠使用NeMo Retriever以更少的訓練獲得更準確的結果，加快上市時間並支援生成式人工智慧應用程式開發中的能源效率

透過NVIDIA AI Enterprise實現可靠、簡單、安全的部署

企業可以部署NeMo Retriever驅動的應用程式，以在幾乎任何資料中心或雲端上的NVIDIA加速運算上進行推論。NVIDIA AI Enterprise支援使用NVIDIA NeMo、NVIDIA Triton 推論伺服器、NVIDIA TensorRT™、NVIDIA TensorRT-LLM和其他NVIDIA人工智慧軟體進行加速、高效能推論。

為了最大化推論效能，開發人員可以在搭載TensorRT-LLM軟體的NVIDIA GH200 Grace Hopper 超級晶片上運行他們的模型。

推出時間

開發人員可以註冊以搶先體驗 NVIDIA NeMo Retriever。

關於NVIDIA（輝達）

NVIDIA（輝達）自 1993 年成立以來始終為加速運算領域的先驅。自 1999 年發明 GPU 起便成功促進 PC 電競市場的成長、重新定義電腦繪圖、引領現代人工智慧時代並推動打造工業數位化。NVIDIA 為一間全方位的運算公司，提供資料中心規模的產品以重塑產業樣貌。欲瞭解更多資訊，請瀏覽 https://nvidianews.nvidia.com/。

熱門新聞