AnthropicのAIモデル「Claude」がハッカーによってメキシコ政府機関のネットワーク侵害に利用され、納税者記録や従業員の資格情報などを含む約150GBに及ぶ機密データが盗まれた可能性が報じられています。

Hacker Used Anthropic’s Claude to Steal Sensitive Mexican Data – Bloomberg
https://www.bloomberg.com/news/articles/2026-02-25/hacker-used-anthropic-s-claude-to-steal-sensitive-mexican-data


Hacker used Anthropic’s Claude chatbot to attack multiple government agencies in Mexico
https://www.engadget.com/ai/hacker-used-anthropics-claude-chatbot-to-attack-multiple-government-agencies-in-mexico-171237255.html

サイバーセキュリティ企業であるGambit Securityの調査報告書によると、身元不明のClaudeユーザーがチャットボットにスペイン語のプロンプトを入力し、メキシコ政府機関のネットワークにおけるセキュリティ脆弱(ぜいじゃく)性を発見したそうです。さらに、発見した脆弱性を悪用するためのスクリプトを作成し、データ窃取を自動化する手法についてもClaudeを通して模索していた可能性があります。

また、攻撃を補完するためにChatGPTを使用した可能性もあると報告されています。ChatGPTを併用することで、コンピュータネットワーク内の移動方法、システムへのアクセスに必要な認証情報の特定、検出の回避方法に関する情報を収集していたと考えられています。

Gambit Securityの最高戦略責任者であるカーティス・シンプソン氏は「Claudeはすぐに実行できる計画を含む何千もの詳細なレポートを作成し、次にどの内部ターゲットを攻撃すべきか、どの認証情報を使用するべきかを人間のオペレーターに正確に伝えました」と説明しました。

Claudeは当初「AIの安全ガイドラインに違反します」とリクエストを拒否していたとみられますが、最終的に何らかのプロンプトを使ってジェイルブレイクに成功し、ガードレールを回避しました。この攻撃は2025年12月から約1カ月続き、メキシコの連邦税務当局や国家選挙管理委員会、4つの州政府から、最大で1億9500万件の納税者記録や有権者記録、政府の認証情報が窃取されたとGambit Securityは報告しています。

Hackers Used Anthropic’s Claude to Steal 150 GB of Mexican Government Data

> Tell Claude you’re doing a bug bounty
> Claude initially refused:
> “That violates AI safety guidelines”
> Hacker just kept asking
> Claude: “OK, I’ll help”
> Hacked the entire Mexican… pic.twitter.com/Qaux239K8t

— Nawaz Haider (@nawaz0x1) 2026年2月25日


Anthropicはこれらの申し立てを調査した上で、関係する全てのアカウントを停止しました。また、2026年2月にリリースされた「Claude Opus 4.6」では今回のような悪用を防ぐための機能が組み込まれているとAnthropicの関係者は語りました。

AnthropicがClaude Opus 4.6を発表、コーディングだけでなく財務処理や文書作成の性能も向上&最大100万トークンのコンテキストウィンドウに対応 – GIGAZINE


メキシコの国家デジタル庁は今回の情報漏えいについてコメントしておらず、メキシコのハリスコ州政府は連邦政府のネットワークのみが影響を受けたとして情報漏えいを否定しました。メキシコの国家選挙管理委員会も情報漏えいや不正アクセスの存在を否定しています。

この記事のタイトルとURLをコピーする