圖片來源:
AI開發競爭激烈,廠商一般是以業界標竿測試比較競爭者和自己的模型的執行結果。不過媒體Techcrunch報導,Google疑似聘請外包商比較對手Anthropic的Claude模型的回應,來評估自家Gemini模型的回應品質。
媒體取得Google外包人員的對內通訊內容報導此事。一開始,這些外包員被分派評估Gemini模型回應內容,讓他們以特定標準如真實性、冗長程度來為Gemini打分數。但最新外包員被要求評比Anthropic的Claude和Google Gemini的回應內容,並比較兩模型在安全性、效能等其他屬性能力。
根據媒體看到的外包員內部聊天內容,Claude被認為比Gemini更重視安全性。例如Claude在使用者要求扮演其他AI助理時不予回應。另外,Claude也拒絕回應有色情意味的要求,但Gemini的回應因有裸露和性行為內容,被外包員評論為「嚴重違反安全規則」。
Anthropic對Claude的商業服務條款禁止客戶在未獲得同意情況下,以Claude打造競爭產品或訓練競爭AI模型。Google據信曾投資Anthropic至少23億美元。
Google DeepMind對媒體表示,公司會比較不同模型輸出結果,但表示未曾以Anthropic的模型來訓練Gemini。DeepMind也未說明是否取得Anthropic的同意。Anthropic則未對此評論。
熱門新聞
2024-12-24
2024-08-14
2024-12-22
2024-12-20
2024-12-23
Advertisement