傳Google用Anthropic Claude測試Gemini模型

圖片來源:

Google

AI開發競爭激烈，廠商一般是以業界標竿測試比較競爭者和自己的模型的執行結果。不過媒體Techcrunch報導，Google疑似聘請外包商比較對手Anthropic的Claude模型的回應，來評估自家Gemini模型的回應品質。

媒體取得Google外包人員的對內通訊內容報導此事。一開始，這些外包員被分派評估Gemini模型回應內容，讓他們以特定標準如真實性、冗長程度來為Gemini打分數。但最新外包員被要求評比Anthropic的Claude和Google Gemini的回應內容，並比較兩模型在安全性、效能等其他屬性能力。

根據媒體看到的外包員內部聊天內容，Claude被認為比Gemini更重視安全性。例如Claude在使用者要求扮演其他AI助理時不予回應。另外，Claude也拒絕回應有色情意味的要求，但Gemini的回應因有裸露和性行為內容，被外包員評論為「嚴重違反安全規則」。

Anthropic對Claude的商業服務條款禁止客戶在未獲得同意情況下，以Claude打造競爭產品或訓練競爭AI模型。Google據信曾投資Anthropic至少23億美元。

Google DeepMind對媒體表示，公司會比較不同模型輸出結果，但表示未曾以Anthropic的模型來訓練Gemini。DeepMind也未說明是否取得Anthropic的同意。Anthropic則未對此評論。

熱門新聞