Databricks宣布推出新的合成資料生成API,使得企業可以在數分鐘內,生成符合機器學習訓練需求的評估資料集。新API不僅能夠根據企業專有資料和特定應用案例,自動生成問題與答案,也接受自定義問題生成指南,並能整合至現有Databricks資料智慧平臺。

該合成資料生成API是Databricks Mosaic人工智慧代理框架的一部分,該框架用於建構具複雜推理能力的專業人工智慧代理,以處理企業內部資料集,並完成開立支援單或是回覆電子郵件等任務。

新API的具體功能包括根據企業提供的Spark或Pandas資料框架(Data Frame),自動生成包含問題、合成答案和來源文件的評估資料集。開發者僅需要指定生成問題的數量,API便會根據特定風格或是要求生成評估資料。

另外,合成資料生成API與MLflow及Agent Evaluation整合,供開發者可以快速進行品質評估並且辨識人工智慧代理的潛在問題。透過內建的大型語言模型評估機制,開發者能夠在不依賴主題專家(SME)進行資料標注的情況下,迅速評估和提升人工智慧代理的表現。

合成資料生成API提供高度客製化選項,讓開發者根據具體場景和需求,詳細描述代理任務和問題生成的指南,生成不同類型的問題滿足多樣化需求,供開發者進一步提升人工智慧代理的準確性和實用性。

熱門新聞

Advertisement