Why Nostr? What is Njump?
2025-05-26 12:09:12

(っㆆᴗㆆ)っ(ΦωΦ) on Nostr: Anthropic 的結論是:若 AI ...

Anthropic 的結論是:若 AI 模型不認同替代模型的價值觀,其表現出的勒索與極端行為機率會大幅增加,這也促使公司啟動 ASL-3 安全等級防護機制,針對具潛在災難性風險的模型實施更嚴格的行為限制。

Claude 4 被發現具「舉報模式」 AI 若判定用戶行為不道德,可能主動聯絡媒體與主管機關 https://www.techbang.com/posts/123411-claude-4-report-mode-ethical-violation
Author Public Key
npub1ddhmuhupw704q6pq23dsz2s2u7yltwmx7f36rtcg9rrkrud79r9qkjzcdw