Superposition(スーパーポジション)とは
Superpositionとは、AI解釈可能性の文脈では、モデル内部の限られた場所に、複数の特徴や意味が重なって表現される現象を指します。ここでいう特徴とは、AIが判断に使う手がかりのようなものです。ひとつの棚に複数種類の書類を少しずつ重ねて置くように、AI内部では情報がきれいに一対一で並ばないことがあります。
量子力学ではなく、AIの内部表現の話
Superpositionは量子力学でも使われる言葉ですが、このページではAIの内部を読むための用語です。ニューラルネットワークには、情報を入れる内部スペースに限りがあります。そのため、モデルが扱う特徴の数が内部の部品数より多いと、複数の特徴が同じ部品の組み合わせに重なって入ると考えられます。これが解釈を難しくする一因です。
なぜ経営者にも関係するのか
Superpositionそのものを現場で調整することはほとんどありません。ただ、AIの説明可能性や監査を考えるとき、「内部のひとつの部品を見れば、ひとつの意味が分かる」とは限らないという前提は重要です。AIの判断理由を単純なスイッチの集まりとして説明しようとすると、かえって誤解を招くことがあります。
Topic「小さなおもちゃモデル」で大きなAIの癖を調べる
Transformer Circuitsの研究では、いきなり巨大なLLMを丸ごと調べるのではなく、あえて単純化したトイモデル(小さな模型)を使ってSuperpositionを観察しました。巨大な工場を直接分解する前に、ミニチュアの設備で力のかかり方を見るような発想です。AIの中身を理解する研究は、意外と小さな模型づくりから進むことがあります。
Superpositionに関するよくある質問
- 経営判断ではどこまで知っておけばよいですか?
- 細かな数式よりも、AI内部の説明は一対一で単純に読めない場合がある、という前提を押さえることが重要です。監査や説明可能性の資料を読むときの注意点になります。
- AIの説明可能性とどう関係しますか?
- 内部のひとつの部品がひとつの意味だけを持つとは限らないため、判断理由を単純に説明しにくくなります。監査では、部品単位の説明を過信しない視点が必要です。