Anthropic 的結論是：若 AI ...

2025-05-26 12:09:12

Anthropic 的結論是：若 AI 模型不認同替代模型的價值觀，其表現出的勒索與極端行為機率會大幅增加，這也促使公司啟動 ASL-3 安全等級防護機制，針對具潛在災難性風險的模型實施更嚴格的行為限制。

Claude 4 被發現具「舉報模式」　AI 若判定用戶行為不道德，可能主動聯絡媒體與主管機關 https://www.techbang.com/posts/123411-claude-4-report-mode-ethical-violation

Author Public Key

npub1ddhmuhupw704q6pq23dsz2s2u7yltwmx7f36rtcg9rrkrud79r9qkjzcdw

Show more details

(っㆆᴗㆆ)っ(ΦωΦ) on Nostr: Anthropic 的結論是：若 AI ...