GPT-1とは

GPT-1とは、2018年6月にOpenAIが発表した、GPTシリーズの最初のモデルです。いまや「GPT」はChatGPTを通じて広く知られていますが、その出発点がこのGPT-1にあたります。Googleが2017年に考案したTransformerという仕組みを土台に、大量の文章で先に学ばせてから、用途ごとに微調整するという、今に続く作り方の原型を示しました。

GPTシリーズの出発点

GPT-1の中核は、事前学習ファインチューニング(微調整)を組み合わせる二段構えにあります。まず膨大な文章を読ませて言葉のつながりを覚えさせ、その後で翻訳や分類など個別の仕事に合わせて仕上げるという流れ。この「土台を作ってから用途に合わせる」発想が、後のGPT-2GPT-3へと受け継がれていきました。なお、GPT-1自体は気軽に会話できる製品ではなく、課題ごとに調整が要る研究段階のモデルだった点も覚えておきましょう。

Topicわずか2年ほどで、規模は約1,500倍に

GPT-1の規模は、AIの設定つまみにあたる「パラメータ」が約1億1,700万個でした。当時としては大型でしたが、2020年のGPT-3では約1,750億個へと、およそ2年で約1,500倍に膨らみます。GPTシリーズは、賢さを引き上げる手段として規模の拡大を一気に推し進めてきました。その急成長のスタート地点が、このGPT-1だったわけです。

GPT-1に関するよくある質問

GPT-1はChatGPTのように会話できたのですか?
いいえ。GPT-1は気軽に対話できる製品ではなく、翻訳や分類など課題ごとに調整が必要な研究段階のモデルでした。「土台を作ってから用途に合わせる」という、今に続く作り方の原型を示した点に意義があります。
GPT-1から今のモデルまで、どれくらい大きくなったのですか?
GPT-1の規模はパラメータ(AIの設定つまみ)約1億1,700万個でしたが、2020年のGPT-3では約1,750億個へ、わずか2年ほどで約1,500倍に膨らみました。規模の拡大で賢さを引き上げる流れの出発点が、このGPT-1です。