BigQuery現在開始提供向量搜尋功能,供用戶能在BigQuery中進行向量相似性搜尋。向量搜尋通常也被稱作近似最鄰近(Approximate Nearest-Neighbor,ANN)搜尋,能夠在高維空間中快速找到與特定向量最相近的向量。

BigQuery的向量搜尋功能允許用戶對儲存於BigQuery的高維資料集,進行快速且準確的搜尋,支援新資料處理和人工智慧應用在內的多種用例,諸如使用大型語言模型進行語義搜尋,或是病歷、交通事故、圖像等相似性搜尋,以及結合檢索強化生成(RAG)技術,強化生成式人工智慧工作負載。

BigQuery的向量搜尋功能提供了一種簡單且直覺的語法,類似BigQuery現有的文字搜尋功能,進而簡化向量搜尋與SQL原語組合,供用戶在BigQuery處理各種資料。向量搜尋功能支援BigQuery嵌入生成功能,針對大型語言模型或是預訓練模型,或是也可以支援以其他方式生成的嵌入。當底層表格資料發生變化時,BigQuery向量索引也會跟著自動更新,用戶也可監控索引更新進度。

LangChain框架可以與BigQuery向量搜尋功能搭配使用,強化自然語言處理。LangChain能夠用於編寫和管理自然語言處理任務工作管線,而BigQuery對LangChain的支援,讓Python開發者方便進行整合,並與其他第三方框架一起使用。向量搜尋功能所提供的VECTOR_SEARCH向量搜尋函式,已經針對分析用例最佳化,能夠有效處理大批次的查詢,而在處理小量輸入資料時,也能夠提供低延遲推理結果。

藉由BigQuery與Vertex AI的整合,用戶可以在同一資料上進行快速、低延遲的線上預測,另外,BigQuery內建的資料治理功能也能派上用場,提供資料遮罩、行級、列級的安全政策。

熱門新聞

Advertisement