モデルとは
モデルとは、AIの分野では、大量のデータで学習させてできあがる「予測や文章生成などを行う本体」を指します。機械学習や深層学習の“成果物”であり、学習を終えたモデルにデータを入れると、答えや文章を返してくれるもの。ChatGPTの土台にあるGPTや、画像を作るDALL-Eなども、こうしたモデルの一種です。プラモデルやファッションモデルとは別の意味で使われる言葉だと、まず押さえておきましょう。
AIのモデルとは何か
AIのモデルは、データから学んだパターンを“溜め込んだ”中身だと考えると分かりやすいでしょう。大量の例で訓練する過程を「学習」、できあがった本体を「モデル」と呼び分けます。料理にたとえるなら、たくさんの調理経験から身につけた「勘やレシピ」がモデルにあたる、というイメージ。
一度作ったモデルは、新しいデータを入れるたびに予測や生成をこなします。性能は、どんなデータで学習したかに大きく左右されるため、何を学ばせたかが、そのままモデルの得意・不得意につながります。
いろいろな「モデル」
ひとくちにモデルといっても、種類はさまざまです。文章を扱う大規模言語モデル(LLM)、画像を作るモデル、音声を扱うモデルなどがあります。ChatGPTのGPT、GoogleのGeminiなどは、いずれも言語モデルの代表例といえるでしょう。
近年は基盤モデル(foundation model)という呼び方も広がりました。幅広い用途に使えるよう、大量のデータで汎用的に訓練したモデルのことで、必要に応じて特定の業務向けに調整(ファインチューニング)して使います。一つの土台を、多くの目的に使い回せるのが持ち味です。
Topic「基盤モデル」という言葉は2021年生まれ
いまや当たり前に使われる基盤モデル(foundation model)という言葉。実は2021年8月に、スタンフォード大学の研究拠点(HAI)が名づけた、比較的新しい呼び名です。それまでバラバラに語られていた「大量データで訓練し、さまざまな用途に応用できる大型のモデル」を、ひとつの言葉でまとめて捉え直したわけです。建物の「土台(foundation)」のように、上へいろいろな応用を載せられる。そんなイメージが、この名前には込められています。
モデルに関するよくある質問
- AIの「モデル」は、プラモデルやファッションモデルと同じ意味ですか?
- 別の意味です。AIのモデルは、大量のデータで学習させてできあがった「予測や文章生成などを行う本体」を指します。機械学習や深層学習の成果物で、データを入れると答えや文章を返してくれるものです。
- モデルと学習は何が違いますか?
- 大量の例で訓練する過程が「学習」、そのできあがった本体が「モデル」です。料理にたとえると、たくさんの調理経験から身につけた勘やレシピがモデルにあたります。
- 「基盤モデル」とは何ですか?
- 幅広い用途に使えるよう大量のデータで汎用的に訓練したモデルのことです。必要に応じて特定の業務向けに調整(ファインチューニング)して使い回せるのが持ち味で、2021年にスタンフォード大学の研究拠点が名づけた比較的新しい言葉です。
- モデルの性能は何で決まりますか?
- どんなデータで学習したかに大きく左右されます。何を学ばせたかが、そのままモデルの得意・不得意につながります。