ボルツマンマシンとは

ボルツマンマシンとは、たくさんの小さな素子(ユニット)のオン・オフが確率的に決まるニューラルネットワークの一種で、データに潜むパターンを学び、それらしいデータを自分で作り出せる初期の生成モデルです。物理学の考え方をAIに持ち込んだ、深層学習の源流のひとつにあたります。

英語表記:Boltzmann machine

「エネルギーが低い状態ほど起きやすい」を学ぶ

名前は19世紀の物理学者ボルツマンにちなんで付けられました。気体の分子が散らばる様子を確率で表した統計力学の発想を借りて、ユニットの状態の組み合わせごとに「エネルギー」という数値を割り当て、エネルギーが低い(=もっともらしい)状態ほど出やすくなるよう重みを調整します。学習が進むと、手元のデータに似た状態を高い確率で再現できるようになる。データの「らしさ」を確率の地形として覚える仕組みだと考えると分かりやすいでしょう。目に見えるデータを受け持つユニットと、背後のパターンを担う隠れたユニットからできています。

そのままでは動かしにくく、改良版が実用を開いた

学習アルゴリズムが示されたのは1985年。ただ、ユニットを増やすと計算量が爆発し、規模を大きくするとうまく学習できなくなる深刻な弱点を抱えていました。そこで接続を間引いて計算を軽くした改良版制限ボルツマンマシン(RBM)が登場し、2000年代後半のディープラーニング復興期に、深いネットワークを一段ずつ準備する用途で活躍しました。ChatGPTの一般公開(2022年11月30日)よりはるか前の話で、今の生成AIから見ると「先祖」にあたる存在です。

経営層にとっての意味は「源流を知ること」

ボルツマンマシンを業務システムに直接組み込む場面は、いまではほとんどありません。価値は別のところにあります。「データの確率分布を学び、新しいデータを生み出す」という今の生成AIの基本姿勢が、どこから来たのかを一本の線でつかめることです。AIの歴史的な背骨を押さえておくと、流行の技術が突然湧いて出たものではないと分かります。

TopicAIの研究なのに、もらった賞は「ノーベル物理学賞」

2024年のノーベル物理学賞は、ボルツマンマシンの研究で知られるジェフリー・ヒントン(ジョン・ホップフィールドと共同)に贈られました。授賞理由には機械学習への基礎的貢献としてボルツマンマシンが明記されています。物理学の統計力学から生まれた手法が、めぐりめぐって物理学賞でAIの土台として評価されたという巡り合わせが話題になりました。

ボルツマンマシンに関するよくある質問

ボルツマンマシンは今のAI開発で実際に使われていますか?
そのままの形で実務に使う場面はほぼありません。規模を大きくすると学習が難しいためです。価値は、現在の生成AIにつながる考え方の源流として理解する点にあります。
ホップフィールドネットワークとは何が違うのですか?
ホップフィールドネットワークはユニットの状態が決まった形で落ち着くのに対し、ボルツマンマシンは状態がサイコロのように確率的に揺らぐ点が大きな違いです。ボルツマンマシンは確率版の発展形と位置づけられます。
「マシン」とありますが、専用の機械(ハードウェア)のことですか?
いいえ。物理的な機械ではなく、コンピュータ上で動く計算モデル(数式と手順)を指す呼び名です。ソフトウェアとして実装される仕組みだと考えてください。

あわせて読みたい記事