Anthropic 於 7 月 1 日在全球恢復了功能完好的 Fable 5,並新增了一個過濾器,能在超過 99% 的嘗試中攔截被標記的黑客提示詞。
美國商務部於 6 月 30 日解除了緊急出口禁令,該模型於次日重新在 Claude Platform、Claude.ai、Claude Code 和 Claude Cowork 上向用戶開放。隨後將透過主要雲端平台提供存取服務。
付費訂閱者可在 7 月 7 日前於每週額度內使用,此後持續存取將改為計量使用點數系統。
該模型曾於 6 月 12 日停止服務。監管機構禁止所有外國國民使用,並僅給公司約 90 分鐘的時間來遵守規定,因此 Anthropic 選擇對所有用戶下架該模型,而非嘗試即時逐一審查用戶身份。
該指令源於一份報告,其中 Amazon 研究人員發現了一個提示詞,能引導模型標記出常見系統中的一系列軟體漏洞。在其中一個案例中,模型更進一步產生了可執行的程式碼,展示如何利用單一漏洞。正是這單一演示,而非漏洞清單本身,引發了警報。
延伸閱讀: CrowdStrike 警告 Claude Mythos 可能加速零日決策
Anthropic 與政府及提交報告的公司共同進行的內部審查證實,弱得多的模型也能發現相同的漏洞,其中包括 Opus 4.8、GPT-5.5 和 Kimi K2.7。團隊檢查的其他所有模型仍能重現那唯一的漏洞利用演示,這使得 Fable 5 獨佔獨特網路武器的說法不攻自破。該公司此前曾稱此禁令為過度擴張。
修復方案範圍狹窄。模型回歸時搭載了一個分類器,能攔截被舉報的提示詞並將其重新導向較弱的 Opus 4.8,在保持 Fable 5 能力完好的同時,會對一般編程產生誤報,並在每次介入時警告用戶。
Mythos 5 是具備相同底層模型但防護措施較少的版本,目前仍被限制在名為 Project Glasswing 的計畫中,僅供約 100 家經過審查的美國組織使用。
該公司還開闢了公開管道以接收越獄報告,並承諾讓監管機構在未來前沿模型發布前更早取得測試權限。
Fable 5 於 6 月 9 日首次推出,是 Anthropic 首款廣泛提供的 Mythos 級別模型,在發布後數天內下架前,曾在多項產業基準測試中備受讚譽。此次中斷僅持續了不到三週。其回歸現在重新奪回了在模型閒置期間被一家快速崛起的中國實驗室悄悄佔據的基準測試領先地位。
閱讀下一篇: XRP 再次測試 1.07 美元,6 月遭拒陰影籠罩多頭


