用語 基本

基盤モデルとは

基盤モデルとは、大量で幅広いデータをまとめて学習させ、さまざまな用途に応用できるようにした大規模なAIモデルのことです。英語ではfoundation model。一つの大きな「土台」を先に作っておき、それを用途に合わせて少し調整するだけで、文章の作成や翻訳、画像の認識など多くの仕事にまわせる点が特徴です。

土台を作り、あとから建て増す

基盤モデルは、ラベル付けされていない膨大なデータから、自分でパターンを学ぶやり方(自己教師あり学習)で鍛えられます。これで「世界の幅広い知識」を一通り身につけた土台ができあがります。あとは、その土台に少しデータを足して特定の仕事向けに仕上げる(ファインチューニング)。一から作り直さずに使い回せるところが、開発の手間とコストを大きく抑えます。

LLMとの違い

よく似た言葉にLLM(大規模言語モデル)があります。LLMは「言語に特化した基盤モデルの一種」で、基盤モデルのほうが大きな括り。画像を扱うCLIPや、文章のBERTGPT-3なども基盤モデルに含まれます。なお、ここで挙げたGPT-3は2020年、BERTは2018年に登場したもので、ChatGPTが広まる前から研究の世界では基盤モデルが育っていました。

ビジネスでの意味

経営の視点では、「巨大な汎用の土台を、各社が自社用に仕立てて使う」時代になった、と捉えると分かりやすいでしょう。ゼロからAIを開発しなくても、既存の基盤モデルを下敷きに、自社の文書や業務へ手早く適用できます。ただし土台はあくまで未完成の出発点。そのまま使えるわけではなく、用途に合わせた調整と検証が前提になります。

Topic「土台」という名前に込められた意味

基盤モデルという呼び名は、2021年にスタンフォード大学の研究チームが、よく考えたうえで名付けた比較的新しい言葉です。建物の「土台(foundation)」になぞらえたのは、土台は最初に築かれるが、それだけでは未完成で、上に建て増ししてはじめて役に立つ、という性質がAIモデルとよく似ているからです。名前ひとつに、技術の本質が映し出されています。

基盤モデルに関するよくある質問

なぜ「基盤(土台)モデル」と呼ぶのですか?
2021年にスタンフォード大学の研究チームが名付けた比較的新しい言葉です。建物の「土台(foundation)」になぞらえたのは、土台は最初に築かれるがそれだけでは未完成で、上に建て増ししてはじめて役に立つ、という性質がAIモデルとよく似ているからです。膨大なデータで作った土台を、用途に合わせてファインチューニングで仕上げて使います。
基盤モデルとLLMは何が違いますか?
LLM(大規模言語モデル)は「言語に特化した基盤モデルの一種」で、基盤モデルのほうが大きな括りです。画像を扱うCLIPや、文章のBERT・GPT-3なども基盤モデルに含まれます。
基盤モデルは経営にどんな意味がありますか?
「巨大な汎用の土台を、各社が自社用に仕立てて使う」時代になったと捉えると分かりやすいでしょう。ゼロからAIを開発しなくても、既存の基盤モデルを下敷きに自社の文書や業務へ手早く適用できます。ただし土台は未完成の出発点で、用途に合わせた調整と検証が前提になります。