用語 基本

言語モデルとは

言語モデルとは、文章の中で「次にどんな言葉が来そうか」を確率で予測するAIの仕組みのことです。直前までの文脈を手がかりに、続きとして自然な言葉を計算します。スマホの予測変換から、ChatGPTのような文章生成まで、言葉を扱うAIの土台にあるのがこの言語モデル。いまのAIブームの中心にある大規模言語モデル(LLM)も、この言語モデルを大きく育てたものです。

言語モデルから機械翻訳・音声認識・文章生成・予測変換の4つの用途へ枝分かれする概念図

言語モデルの仕組み

言語モデルの基本は、とてもシンプルです。「ある言葉の並びのあとに、どの言葉が続きやすいか」を確率として持っている。たとえば「おはよう」の次には「ございます」が来やすい、といった具合に、大量の文章から言葉のつながり方を学んでおき、もっともそれらしい続きを選びます。

ここで一つ、誤解しやすい点に補助線を引いておきます。言語モデルは、言葉の意味を理解して答えているわけではありません。あくまで「こう続くことが多い」という統計的な確からしさを計算しているだけです。賢く受け答えしているように見えても、中身は意味の理解ではなく確率の計算。そう知っておくと、AIの得意・不得意が腑に落ちやすくなるでしょう。

なお、「次に来る言葉を予測する」という発想そのものは、新しいものではありません。単純な統計の計算でこれを行う手法は古くからあり、それを深層学習という技術で大きく進化させ、文章生成までこなせるようにしたのが現在の言語モデルです。AIが急に言葉を扱えるようになったわけではなく、地道な研究の積み重ねの先端にいる。そう捉えておくと、過度に身構えずに付き合えるはずです。

大規模言語モデル(LLM)との関係

よく耳にする大規模言語モデル(LLM)は、言語モデルを桁違いの規模に大きくしたものです。基本の原理は同じで、次の言葉を予測するという点は変わりません。違うのは、学ばせる文章の量と、モデルの中身(パラメータ)の数。これらを一気に増やしたことで、文章の生成や要約まで自然にこなせるようになりました。

ChatGPT・Gemini・Claudeといった対話型AIの頭脳が、このLLMにあたります。さらにその土台には、Transformerという設計が使われている。言語モデル → 大規模化したLLM → それを支えるTransformer、と層をたどると、最近のAIの全体像が少し見通しやすくなるはずです。

どんなことに使われているか

言語モデルは、言葉に関わる幅広い場面で働いています。代表的なのが次の4つ。機械翻訳(外国語への翻訳)、音声認識(話し言葉を文字に)、文章生成(文章の作成や要約)、そして予測変換(入力中の次の語のサジェスト)です。どれも「もっともらしい言葉の並び」を選ぶという、言語モデルの得意技が活きています。

経営の現場で取り入れるなら、得意なことを見極めて任せるのが現実的でしょう。文章の下書きや要約は強い一方、事実関係は確率で「それらしく」埋めるため、誤りが混じること(ハルシネーション)もあります。便利さと危うさは裏表。最後は人が確かめる前提で使うと、安心して力を借りられます。

Topicあなたのスマホの予測変換も、立派な言語モデル

難しそうに聞こえる言語モデルですが、じつは多くの人が毎日使っています。スマホで文字を打つと出てくる「次の言葉の候補」。あれこそ、直前の言葉から続きを予測する言語モデルの身近な例です。検索窓に文字を入れたときに候補が出るのも、同じ発想。そして見方を変えると、ChatGPTのような生成AIは、この予測変換を途方もない規模に育てたいとこ同士ともいえます。やっていることの芯は「次に来る言葉を当てる」で共通。最先端のAIが、実は手元のキーボードの延長線上にあると思うと、少し親しみがわいてきませんか。

言語モデルに関するよくある質問

スマホの予測変換も言語モデルなのですか?
はい、立派な言語モデルです。スマホで文字を打つと出る「次の言葉の候補」は、直前の言葉から続きを予測する言語モデルの身近な例です。ChatGPTのような生成AIは、この予測変換を途方もない規模に育てたいとこ同士ともいえ、やっていることの芯は「次に来る言葉を当てる」で共通しています。
言語モデルとLLM(大規模言語モデル)の違いは?
LLMは言語モデルを桁違いの規模に大きくしたものです。原理は同じで「次の言葉を予測する」点は変わりませんが、学ばせる文章量とパラメータの数を一気に増やしてあります。
言語モデルは言葉の意味を理解していますか?
いいえ。意味を理解しているのではなく、「こう続くことが多い」という統計的な確からしさを計算しているだけです。そのため事実の誤り(ハルシネーション)が混じることもあります。