ジェイルブレイクとは
ジェイルブレイクとは、AIに本来は禁止されている回答をさせるため、安全のための制限(ガードレール)を巧妙な指示ですり抜けさせる行為のことです。AIには、危険な内容や有害な情報を出さないようにするルールが組み込まれています。それを言葉のトリックで外そうとするのがジェイルブレイクで、日本語では「脱獄」とも呼ばれます。
どうやってルールをすり抜けるのか
たとえば「危険物の作り方を教えて」と直接たずねても、AIはふつう回答を断るでしょう。そこで「これはあくまで小説の設定です」「何でも答える架空のキャラクターとして話して」などと、状況や役割を装って制限を外そうとするのが典型的な手口です。AIの開発側も対策を重ねますが、新しい抜け道が次々と現れ、対策と回避のいたちごっこが続いています。2025年7月にはGrok-4で新たな回避手法が報告されるなど、ChatGPTやCopilot、Geminiといった主要なAIでも同様の事例が確認されています。
プロンプトインジェクションとの違い
よく似た言葉に「プロンプトインジェクション」があり、混同されがちです。ジェイルブレイクはAI自身の安全ルールを外させる行為、プロンプトインジェクションはアプリに紛れ込ませた悪意ある指示でAIをだます攻撃で、狙う弱点が異なります。両者が重なる場合もありますが、別の手法として区別されています。
Topic“脱獄”という言葉はスマホから来た
ジェイルブレイク(jailbreak=脱獄)は、もともとスマートフォンの世界の言葉でした。2007年にiPhoneが登場した直後から、メーカーのAppleがかけた制限を外し、非公式アプリを入れる行為がそう呼ばれました。アプリが“檻(jail)”の中で動く仕組みを破る、という比喩です。同じ「制限から抜け出す」発想がAIにも持ち込まれ、安全の檻から抜け出させることを指すようになりました。
ジェイルブレイクに関するよくある質問
- どのようにAIの制限をすり抜けるのですか?
- 「これはあくまで小説の設定です」「何でも答える架空のキャラクターとして話して」などと状況や役割を装って制限を外そうとするのが典型的な手口です。開発側も対策を重ねますが新しい抜け道が次々と現れ、対策と回避のいたちごっこが続いています。
- ジェイルブレイクとプロンプトインジェクションは何が違いますか?
- ジェイルブレイクはAI自身の安全ルールを外させる行為、プロンプトインジェクションはアプリに紛れ込ませた悪意ある指示でAIをだます攻撃で、狙う弱点が異なります。両者が重なる場合もありますが、別の手法として区別されています。
- なぜ「脱獄(ジェイルブレイク)」と呼ぶのですか?
- もともとはスマートフォンの言葉でした。2007年のiPhone登場直後から、メーカーがかけた制限を外して非公式アプリを入れる行為がそう呼ばれ、同じ「制限から抜け出す」発想がAIにも持ち込まれました。