GPT-3とは

GPT-3とは、OpenAIが2020年に公開した大規模言語モデル(LLM)の一つです。文章の続きを予測する仕組みを大きく育てたモデルで、例をいくつか見せるだけで翻訳や要約などさまざまな作業をこなせる点が、当時大きな驚きをもって受け止められました。名前のとおり、GPTシリーズの3代目にあたります。

GPT-3の特徴

GPT-3の規模を示す数字が、約1750億個といわれるパラメータの多さです。パラメータはAIが言葉のパターンを覚えておくための無数の「調整つまみ」のようなもので、発表当時としては桁外れの規模でした。

ただし、つまみの数が多いほど何でも正確に答えられる、というわけではありません。GPT-3も事実と異なる内容をそれらしく書いてしまうことがあり、規模の大きさと答えの正しさは別ものだと捉えておきたいところ。

ChatGPTより前に登場していた

つまずきやすいのが登場した時期です。GPT-3が公開されたのは2020年で、ChatGPTが一般に公開された2022年11月より前のできごとでした。「GPT=ChatGPT」と思われがちですが、GPT-3はもともと開発者がプログラムから利用するためのモデルとして提供されました。

その後、改良版のGPT-3.5が2022年に登場し、初代のChatGPTはこのGPT-3.5を土台に作られています。さらにGPT-4などの後継が続き、OpenAIの主力はより新しい世代へと移ってきました。GPT-3は、いまの対話型AIにつながる流れをつくった初期の重要なモデルという位置づけになります。

なぜ重要だったのか

GPT-3が示したのは、一つのモデルが「指示の仕方しだいで」幅広い仕事に使えるという可能性でした。専用のプログラムを作り込まなくても、言葉で頼むだけでAIに作業を任せられる。この手軽さが、その後ビジネスでのAI活用が一気に広がる下地になったといえるでしょう。

Topic「例を見せるだけ」がもたらした衝撃

GPT-3が研究者を驚かせたのは、新しい作業を覚えさせるのにモデルの作り直しが要らなかった点です。やりたいことの例をいくつか文章で見せるだけで、その場でコツをつかんで応える。この性質はfew-shot learning(数例からの学習)と呼ばれます。わざわざ訓練し直さなくても、頼み方しだいでAIの振る舞いが変わる。いまでは当たり前になった「プロンプトを工夫してAIを使いこなす」という発想は、このGPT-3の発見から本格的に広がっていきました。

GPT-3に関するよくある質問

GPT-3の何がそんなに驚きだったのですか?
新しい作業を覚えさせるのにモデルの作り直しが要らなかった点です。やりたいことの例をいくつか文章で見せるだけで、その場でコツをつかんで応える(few-shot learning)。「プロンプトを工夫してAIを使いこなす」という今では当たり前の発想は、2020年のGPT-3から本格的に広がりました。
GPT-3とChatGPTは同じものですか?
違います。GPT-3の公開は2020年で、ChatGPTの一般公開(2022年11月)より前です。GPT-3はもともと開発者がプログラムから使うモデルとして提供され、改良版のGPT-3.5を土台に初代ChatGPTが作られました。
パラメータが約1750億個あれば正確に答えられますか?
必ずしもそうではありません。GPT-3も事実と異なる内容をそれらしく書いてしまうことがあり、規模の大きさ(つまみの数)と答えの正しさは別ものだと捉えておくとよいでしょう。
GPT-3はなぜ重要だったのですか?
一つのモデルが指示の仕方しだいで幅広い仕事に使えると示した点です。専用プログラムを作り込まず、言葉で頼むだけでAIに作業を任せられる手軽さが、その後ビジネスでのAI活用が一気に広がる下地になりました。