Anthropicは6月10日、これまで制限されていたMythosモデルの一般公開版となるClaude Fable 5を発表した。これにより、これまでで最も高性能とされる脆弱性発見AIが、サブスクリプション契約者であれば誰でも利用できるようになった。分散型金融(DeFi)分野への影響は即時的と考えられる。
これまでMythosはProject Glasswingのもとでロックされており、GoogleやMicrosoft、JPモルガンなど、選ばれた約150団体だけがアクセスできた。同モデルはすでに、世界の重要ソフトウェア上で1万件を超える重大な脆弱性を発見している。
Anthropicによれば、Fable 5には厳格な安全制限が設けられている。サイバーセキュリティ、生物学、化学、モデル蒸留など、リスクの高い分野では応答をブロックし、Claude Opus 4.8へ自動的に切り替える仕様。
Anthropicは、Fable 5のリリース前にクラシファイアのストレステストとして、脱獄(jailbreak)試行を繰り返し、外部バグ報奨金プログラムも実施した。1000時間超の検証において、広範な脱獄事例は報告されていない。
セキュリティ分野でセンシティブなリクエストが発生した場合、5%未満のセッションで自動切替が発生するにとどまり、ほとんどのやり取りはFable 5の全機能を活用できる。
DeFi分野においては、スマートコントラクトの悪用はAnthropicのブロック対象に明確には該当しない。Solidityコントラクトの脆弱性発見は、伝統的なサイバー攻撃というよりも、コーディングタスクの色合いが強い。
Fable 5のソフトウェア工学領域での性能は際立っており、タスクが長大かつ複雑になるほど、現行他モデルとの性能差が拡大する。監査されていないDeFiプロトコルがオンチェーンで公開されている場合、この差異は極めて大きな意味を持つ。
Zcashコミュニティでの先例はセキュリティ業界で広まっている。Anthropicアーキテクチャの軽量版が、Zcashプロトコルの重大な欠陥を24時間以内に発見した事例がある。この脆弱性は、世界有数の暗号学者による4年間の審査をすり抜けていた。
Fable 5の登場は、スマートコントラクトの弱点を検証するために必要なコストとスキルを劇的に引き下げる。ホワイトハットハッカーのMevenRekt氏は、「スマートコントラクトの脆弱性発見に要するコストもスキルも、事実上ゼロになる」と明言する。
監査を受けていないプロトコルは格好の標的となる。既知の脆弱性はフォーク上で繰り返し悪用され、わずかなプロジェクトですら攻撃対象となる。なぜなら、攻撃コストがほぼゼロに抑えられるためである。
Anthropic自身も先週警告しているが、AIシステムの進化は急速で、このまま進めば人間の介入なく自律的に自己改良を進める「再帰的自己進化」も現実味を帯びている。
セキュリティ専門家は、トークン承認の取消し、資金のハードウェアウォレットへの移動、十分に信頼できないプロトコルへの接触断絶を迅速に推奨している。あすではなく、本日実行するべきとの指摘が目立つ。
