現今以生成式AI為主的人工智慧浪潮越演越烈,許多企業為跟進這股熱潮,選擇在雲端啟動AI開發。但不少公司逐漸發現盲點,投入AI模型開發的初衷,無非是協助各部門提高生產力;但礙於企業難以將營運機敏資料上傳雲端,連帶迫使財務分析、現場生產…等對話機器人發展計畫陷於難產。
為打破僵局,企業終究會選擇回歸地端訓練AI模型。可以預見,當企業決定重返地端執行AI訓練,往往會優先部署GPU算力;但持平而論,算力固然重要,但絕非唯一成功要素。譬如近期火紅的檢索增強生成(RAG)架構,它必須從大型資料庫檢索相關資訊,據此生成有意義的回答或文本,假使資料數量不足或品質欠佳,恐因檢索結果不夠準確,影響生成內容的可靠性。
因此包括資料的管理與儲存議題,對於企業RAG架構成敗著實至關重大,其重要性完全不亞於算力。著眼於此,威聯通科技(QNAP)近期大力展開訴求,強調其QNAP NAS與生俱來蘊含多重優勢,足以確保RAG模型達到高效能、高可靠度,進而協助企業優化AI開發環境。
利用Qsirch強大搜尋功能,加速執行資料清洗
威聯通科技行銷經理張凱耀分析,驅使企業在地端執行AI開發,主要原因大致有四,分別是資料安全與隱私、成本控制、效能與客製化、合規性。以大家頗為關注的成本控制為例,現今主流AI應用圍繞在文生文、文生圖,但未來一旦演進到文生影片,屆時企業若選擇在雲上開發,恐大幅墊高費用支出,若為避免承受如此沈重財務負擔,別無他法,只能返回地端。
因此他深信企業在地端訓練AI模型,可望成為大勢所趨。而企業在肇建AI開發環境的過程,除佈局算力外,亦會因應RAG架構需求,導入對應的資料管理與儲存機制,連帶為QNAP NAS帶來莫大契機;因為綜觀市面上各個廠牌或各種類型的儲存設備,QNAP NAS算是作為RAG儲存或備份伺服器的最適標的先從原始資料儲存議題說起。對於RAG,原始資料清洗是極為重要的一環,若清洗得不確實、意即標準化(Standardized)做得不到位,必定影響後續生成品質。而原始資料經過Standardized,去除掉歧義值、重複值後,丟給Embedding Model轉成向量化資料,再存入向量資料庫(VectorDB),然後透過LLM,產生人們可理解的語意表達方式;向量資料累積得越多,代表資料維度越多,AI模型準確性就越高。
資料管理及儲存對於 RAG 架構的成功運行有關鍵作用。高質量的數據、快速的數據存取、安全性保障、一致性和靈活的擴展能力都是確保 RAG 模型性能和可靠性的重要因素。
面對不斷湧進的大量原始資料,有些企業採取「土炮」模式,利用白牌伺服器的內置硬碟空間加以儲存,但事實上QNAP NAS擁有許多相對優勢,遠比白牌伺服器更勝任這個角色。例如QNAP NAS透過獨家開發的QuObjects軟體,得以支援S3 Compatible物件儲存,便於開發者輕鬆將儲存在雲端S3空間的資料遷回地端,反觀一般儲存伺服器普遍不支援物件儲存;更值得一提,企業在雲上用來呼叫Bucket裡面資料的API,完全不必修改,即可直接在QNAP NAS環境沿用,僅需將目標從雲端Bucket轉移至NAS Bucket即可。
其次QNAP NAS原生支援Samba與NFS協定。因資料清洗偏向人工作業,此時若以Samba與NFS為基礎,即可讓帶有Windows、Linux或macOS不同儲存載體的工作人員,能夠在不同平台間無縫存取資料,共同完成清洗作業。
再來更重要的,QNAP NAS獨家提供Qsirch App,內建強大的全文檢索與AI語意搜尋引擎。協助使用者透過關鍵字搜尋,快速從NAS找出所需文件、圖片、影片、電子郵件等各種檔案;另可透過AI語意搜尋,以口語化指令精準找出所需照片;甚至支援超智慧AI OCR功能,方便使用者一鍵框選、擷取、複製與下載圖片中的文字。總體來說,Qsirch能協助資料清洗團隊成員快速找出重複、不準確和不完整資料,從而予以刪除,順勢提高資料品質。
擁有完整全快閃產品線,並支援25/100 GbE高速網路
張凱耀強調,QNAP NAS蘊含的利基不僅止於此,還支援多版本Snapshot,讓開發者在必要時將原始資料回復到先前版本。此外支援WORM,防止未經授權的資料修改,保障資料的一致性與完整性。且支援PB級擴充,有利於企業收納日益龐大的原始資料量體。
除作為原始資料儲存用途外,QNAP NAS也適合作為RAG 架構的儲存/備份伺服器。它之所以適合擔綱這個角色,在於擁有完整的全快閃(AFA)產品線,有助營造高IOPS、低延遲特性,確保所有資料能快速被檢索與處理。不僅如此,QNAP NAS除支援業界常見的10GbE網路外,還將支援範圍擴及25GbE網路、甚至100GbE網路,確保大量資料能在設備之間高速傳輸;此一特質,對於需要頻繁讀寫巨量資料的RAG架構非常重要,有助提高生成式AI系統的整體運作效能。
張凱耀透露,展望下一步,QNAP有意在RAG架構中扮演更積極角色,不排除利用NAS設備直接支援GPU卡的安裝,直接變身為AI伺服器。事實上美國一家名為StorageReview的專業媒體,曾經做過一項試驗,將QNAP的TS-h1290FX NAS改造成為一台RAG Server,意謂此事情基本上是可以做到的。
總括而言,因QNAP NAS富含眾多優勢條件,所以勝任RAG架構當中Raw Data Storage、AI Server Storage雙重角色。使得重回地端執行AI模型訓練的企業,能夠在算力、資料管理與儲存等兩大面向同時並進,不會顧此失彼,進而打造出最佳化AI開發環境,加速提升創新競爭力。
點擊了解 → 使用 QNAP NAS 最佳化企業 AI 開發
熱門新聞
2024-11-10
2024-11-10
2024-11-10
2024-11-08
2024-11-02