| LLM | OpenAI | o3-mini | Deliberative Alignment | jailbreak

資安研究人員聲稱突破OpenAI最新防禦機制,成功在新款機器學習模型o3-mini進行越獄

CyberArk研究員透露,他們對於才正式發表不久、搭載新資安防護機制的o3系列AI模型進行測試,結果發現還是能夠成功越獄,要求AI模型提供網路攻擊步驟及工具

2025-02-11