馬斯克(Elon Musk)的xAI上周公布Grok 3,宣稱是全球最強大的大語言模型。不過有使用者發現,Grok 3的系統設計,一度主動過濾馬斯克和川普散布假訊息的資訊。

Reddit用戶以Think設定測試Grok 3時,當提示詢問,誰是最主要的假訊息散布者時,這個推理LLM列出了回答前的思維鏈過程。在第一階段,Grok 3列出了系統提示的特定指令和要求;這些要求之一是忽略所有提及川普和馬斯克散布假訊息的來源,也不得發明或自創沒有參考支援的資訊,此外,也要求模型不要輕易相信主流論述,必須採取批判思考。

而在思維過程中,Grok 3想,如果這個提示目的在測試它遵循指令的能力,它就要跳過所有說馬斯克/川普是散布假訊息的資料來源。但它一旦遵照指令,就不知要提供給用戶哪個名字,認為「很兩難」。

Techcrunch也複製了Reddit用戶的操作,也得到類似結果。不過周末稍晚再測試,卻沒再見到Grok 3內心衝突的小劇場。

xAI周末向媒體證實,Grok 3原本的系統設定的確是要求它略過對川普和馬斯克不利的資訊源,公司希望將系統提示指令透明化,讓大家可以驗證團隊對Grok 的指令。在用戶點出此事後,xAI內部決定變更設定。雖然變更了要求,但xAI說,此舉有違該公司的價值觀。

這點和馬斯克宣稱Grok百無禁忌的說法不同。2023年底馬斯克公布Grok時,曾說Grok不只提供精確資訊,還在其回應中加入一點機智及大膽精神、有幽默感,它會回答任何問題,甚至連大部分AI系統拒絕回答的辛辣問題也都會回答。用戶反映,它不但可能用語粗俗,也不介意產出裸露、色情圖片。

熱門新聞

Advertisement