FGSMとは

FGSMとは、AIをだます細工データ(敵対的サンプル)を、ごくわずかな計算で素早く一度に作り出す代表的な攻撃手法のことです。2014年にGoogleの研究チームが発表しました。難しい計算を何度も繰り返さなくても、AIの「弱点の方向」へ一押しするだけで誤判定を引き起こせる。その手軽さから、AIがどれだけ攻撃に弱いかを測る「ものさし」として広く使われています。

英語表記:Fast Gradient Sign Method(高速勾配符号法)

弱点の方向へ、一度だけ押す

AIは学習の途中で「どちらに間違えやすいか」という方向を内部に持っています。FGSMはそのいちばん間違えやすい方向を計算し、そこへ小さなノイズをまとめて一度だけ足すという、とてもシンプルな手口です。何度も試行錯誤する手法に比べて計算が軽く、一瞬で細工を作れるのが持ち味。「速く・安く攻撃できる」という事実そのものが、AIの守りを考えるうえで重い意味を持ちます。

研究と防御の「基準点」になった

FGSMが画期的だったのは、攻撃の手軽さだけではありません。発表した研究チームは、AIが細工に弱いのは「複雑すぎるから」ではなく、むしろ仕組みが単純(直線的)だからだと指摘しました。この見方は、ある一つのAIをだます細工が別のAIにも効きやすい理由を説明します。以後、新しい防御を試すときは「まずFGSMに耐えられるか」を確かめるのが定番になりました。攻撃手法でありながら、守りの実力を測る最初のテストとして役立っているわけです。

「簡単に攻撃できる」が前提になる

経営の立場で押さえておきたいのは、AIをだます細工は、高度な設備がなくても短時間で作れてしまうという現実でしょう。攻撃のハードルが低いということは、守る側は「狙われにくいから大丈夫」とは言いにくい。AIを判定や検査に使うなら、攻撃が安く作れる前提で、人の確認や別の検知を組み合わせておくのが堅実です。手軽な攻撃に最低限耐えられるかは、ベンダーへの確認項目にもなります。

Topicパンダが99.3%の自信で「テナガザル」になった話

FGSMを語るとき必ず登場するのが、論文に載った一枚の図です。パンダの写真(AIは信頼度57.7%で「パンダ」と判定)に、人間には砂嵐とも気づけないほど薄いノイズを重ねると、AIは同じ画像を信頼度99.3%で「テナガザル」と言い切ってしまった。間違えただけでなく、より強い自信で間違えたところが不気味です。ちなみにこの実験はChatGPTの一般公開(2022年11月30日)より前、生成AIブームのずっと手前で示されていました。AIの「自信」は正しさの保証ではない、と教えてくれる一例です。

FGSMに関するよくある質問

FGSMとPGDは何が違いますか?
FGSMは弱点の方向へ一度だけノイズを足す「速さ重視」の手法です。PGDはその一押しを少しずつ何度も繰り返す「強さ重視」の手法で、より手強い細工を作れます。速いFGSM、強いPGD、と覚えると整理しやすいです。
2014年の手法なら、もう古くて関係ないのでは?
今も基準として現役です。新しい防御を試すとき「まずFGSMに耐えられるか」を確かめる出発点として使われ続けています。古いから無効、というものではありません。
FGSMはAIを攻撃するための悪用ツールなのですか?
もともとはAIの弱点を解明し、守りを強くするために生まれた研究手法です。防御の性能評価や、攻撃に耐える訓練(敵対的学習)にも使われ、主に研究・防御の場面で用いられています。

あわせて読みたい記事