| Anthropic | Claude | 混合推理 Claude Code | 程式設計

Anthropic發布市場上首款混合推理模型Claude 3.7 Sonnet

Anthropic推出Claude 3.7 Sonnet,這是第一款混合推理大型語言模型,可依需求快速回應或深度思考,強化程式設計能力,並推出Claude Code協助開發者自動化開發流程

2025-02-26

| Anthropic | 人工智慧安全 | Dario Amodei | AI Action Summit

Anthropic執行長警告AI發展速度超過預期,各國須加速應對安全與經濟衝擊

Anthropic執行長Dario Amodei警告人工智慧發展超乎預期,可能在2030年前達到超高智慧水準,呼籲各國加速應對安全風險與勞動市場衝擊

2025-02-14

| Anthropic | AI安全 | 越獄攻擊 | 憲法式分類器 | LLM

Anthropic公開憲法式分類器,大幅降低AI越獄攻擊成功率

Anthropic推出憲法式分類器,透過預設規則與分類器訓練,提高大型語言模型防禦能力。在測試中,該技術將越獄成功率從86%降至4.4%,拒絕率僅增0.38%,現已開放測試平臺供試驗

2025-02-06

| Anthropic | Claude

Anthropic 計畫為Claude加入雙向語音模式

根據Anthropic執行長Dario Amodei最近公開受訪透露,他們預計為Claude增加雙向語音模式,允許使用者對Claude口說輸入問題或提示並聽取其回應

2025-01-28

| Claude | Citations | AI | 資料來源 | 可信度 | Anthropic | 大型語言模型 | 自然語言處理 | NLP | Vertex AI

Anthropic推出Claude Citations功能,強化AI回應的來源驗證與可信度

Anthropic新的Claude Citations功能,能直接引用資料來源,提升生成式人工智慧回應可信度,目前已整合至Anthropic API與Google雲端供開發者使用

2025-01-24

| 微軟 | OpenAI | Anthropic

微軟發表MEDEC基準評估AI醫療應用,論文估計GPT-4o-mini僅約80億參數

微軟發表MEDEC醫療錯誤檢測基準,評估市面上多個語言模型表現,皆遜於人類醫生,論文還揭露GPT-4o-mini參數估計僅約80億

2025-01-06

| Anthropic | 環球音樂 | 侵權

Anthropic同意設護欄阻歌詞侵權,與唱片出版業者暫達協議

Anthropic與唱片業者達成協議,將在其人工智慧產品中設置安全護欄,防止Claude輸出受版權保護的歌詞,暫時緩解雙方版權爭議,但訓練資料授權問題仍待解決

2025-01-06

| Anthropic | Claude | Gemini | google

傳Google用Anthropic Claude測試Gemini模型

媒體Techcrunch報導指出,Google透過外包人力針對自家Gemini模型與Claude模型的回應品質進行評比

2024-12-25

| Anthropic | AI | Alignment Faking

AI模型對安全訓練陽奉陰違,策略性掩蓋偏好以迎合訓練者

研究顯示人工智慧模型存在對齊偽裝行為,即表面遵守安全訓練目標,但保留原始偏好,並在特定情境中顯露出來,該現象凸顯現有安全訓練方法的限制,需深入理解機制以確保人工智慧的安全

2024-12-22

| IT周報 | Meta | AI代理 | LLM | 影像生成 | Anthropic | 小模型 | 生成式AI | 超級電腦 | Nvidia

AI趨勢周報第264期:從虛擬人到LLM社交智力測試,Meta開源9大研究成果

Meta一口氣開源9大研究成果;ChatGPT整合30多種第三方桌面應用程式;Nvidia推出輕巧實惠的生成式AI超級電腦;微軟發布140億參數小語言模型Phi-4;Google DeepMind推Veo 2影像生成模型;Anthropic推出Claude使用分析系統Clio

2024-12-20

| Anthropic | Clio | 分析

Anthropic針對AI隱私保護與安全分析需求,公開Claude使用分析系統Clio

Anthropic發布Clio系統,該系統利用匿名化與資料聚合技術,在保護用戶隱私的前提下,分析AI模型應用情境,掌握用戶使用模型的狀況,同時減少安全誤報與漏報風險

2024-12-17

| Anthropic | Model Context Protocol | MCP | 連接器 | AI助理

Anthropic開源可用來連結AI助理與資料的Model Context Protocol

Claude模型開發商Anthropic釋出模型脈絡協定(Model Context Protocol,MCP),此一新標準可用來連結AI助理及資料系統,使AI助理可透過單一協定存取所有的資料來源

2024-11-26