DeepSeek-R1の作り方は何が画期的だったのですか？

人間が用意した模範解答をなぞらせるのではなく、試行錯誤の報酬だけで推論の手順をAI自身に見つけさせた点です（強化学習）。答え合わせを繰り返すうちに「いったん立ち止まって考え直す」ような振る舞いを自分で身につけたとされ、学習のやり方そのものが研究者の間で驚きをもって受け止められました。土台は同社のDeepSeek-V3です。

ふつうの言語モデルと何が違うのですか？

ふつうの言語モデルは質問にすぐ答えますが、DeepSeek-R1はいったん頭の中で順を追って考え、その過程を示してから答えます。数学やプログラミングのように筋道を立てて解く問題で力を発揮し、公開時にはOpenAIの推論モデルo1に匹敵する成績だと話題になりました。重みはMITライセンスで公開され、誰でも自社で動かせます。

DeepSeekショックとは何ですか？

R1が安く高性能だったことから、公開直後の2025年1月にエヌビディアの株価が一時的に大きく下落した出来事です。高価な半導体を大量に使わなくても最先端に迫れるのではという見方が広がりました。

DeepSeek-R1(ディープシークアールワン)とは？意味をわかりやすく解説

DeepSeek-R1とは、中国のDeepSeek社が2025年1月に公開した、答えを出す前に思考の過程をたどる推論特化のAIモデルのことです。理解の鍵は、推論に特化している点、学び方が独特な点、そして重みを公開している点の3つです。

DeepSeek-R1を理解する3つの鍵（推論特化・強化学習・重み公開）への枝分かれ図

一歩ずつ考えてから答える「推論モデル」

ふつうの言語モデルは、質問にすぐ答えを返します。DeepSeek-R1は、いったん頭の中で順を追って考え、その過程を示してから答えるように作られた推論モデルです。数学やプログラミングのように、筋道を立てて解く問題ほど力を発揮します。まず2024年11月に試作版が示され、正式版が2025年1月に公開されました。公開時には、OpenAIの推論モデルo1に匹敵する成績だと話題になりました。

考えの過程を示すことには、実用上の意味もあります。答えだけを返されると正しさを確かめにくいものですが、どう考えてその結論に至ったかが見えると、利用者は途中の筋道を点検できます。経営の現場でも、結論に至る理由が追えることは、AIの出力を鵜呑みにせず判断材料として扱ううえで役立つでしょう。

「手本なし」で考え方を身につけた

R1の作り方には特徴があります。同じDeepSeek社の大規模モデルDeepSeek-V3を土台に、人間が用意した模範解答をなぞらせるのではなく、試行錯誤を通じて自分で推論の手順を見つけさせるという鍛え方をしました。良い答えにたどり着けたら報酬を与える、強化学習という方法です。手本を細かく与えなくても、AIが自力で「考え方」を獲得できたことが、研究者の間で驚きをもって受け止められました。

重みを公開し、誰でも使える

DeepSeek-R1は、モデルの中身（重み）をMITライセンスで公開しています。無償で取り込み、自社のサーバーで動かしたり改良したりできる、制約のゆるいオープンウェイトです。高い性能の推論モデルが自由に使える形で出たことは、AIを内製したい企業にとって選択肢を広げました。中国発のモデルが世界の最先端と肩を並べる水準に達したことを示す例でもあります。

市場を揺らした「DeepSeekショック」

R1が安く高性能だったことは、市場にも波紋を広げました。公開直後の2025年1月、エヌビディアの株価が一時的に大きく下落し、いわゆるDeepSeekショックと呼ばれました。高価な半導体を大量に使わなくても最先端に迫れるのではという見方が広がったためです。この出来事の背景は、開発元のDeepSeekのページでも詳しく触れています。

TopicAIが自分で「考え方」を発見した

従来、AIに推論をさせるには、人間が解き方の手本を大量に用意して教えるのが一般的でした。DeepSeek-R1で注目されたのは、その手本をほとんど与えず、試行錯誤の報酬だけで推論の手順を自分で見つけさせた点です。答え合わせを繰り返すうちに、AIが「いったん立ち止まって考え直す」ような振る舞いを自分で身につけていったとされ、学習のやり方そのものが話題になりました。

DeepSeek: DeepSeek-R1 (GitHub)

DeepSeek-R1に関するよくある質問

DeepSeek-R1の作り方は何が画期的だったのですか？: 人間が用意した模範解答をなぞらせるのではなく、試行錯誤の報酬だけで推論の手順をAI自身に見つけさせた点です（強化学習）。答え合わせを繰り返すうちに「いったん立ち止まって考え直す」ような振る舞いを自分で身につけたとされ、学習のやり方そのものが研究者の間で驚きをもって受け止められました。土台は同社のDeepSeek-V3です。
ふつうの言語モデルと何が違うのですか？: ふつうの言語モデルは質問にすぐ答えますが、DeepSeek-R1はいったん頭の中で順を追って考え、その過程を示してから答えます。数学やプログラミングのように筋道を立てて解く問題で力を発揮し、公開時にはOpenAIの推論モデルo1に匹敵する成績だと話題になりました。重みはMITライセンスで公開され、誰でも自社で動かせます。
DeepSeekショックとは何ですか？: R1が安く高性能だったことから、公開直後の2025年1月にエヌビディアの株価が一時的に大きく下落した出来事です。高価な半導体を大量に使わなくても最先端に迫れるのではという見方が広がりました。

DeepSeek-R1(ディープシークアールワン)とは

一歩ずつ考えてから答える「推論モデル」

「手本なし」で考え方を身につけた

重みを公開し、誰でも使える

市場を揺らした「DeepSeekショック」

TopicAIが自分で「考え方」を発見した

DeepSeek-R1に関するよくある質問

あわせて読みたい記事

OpenAI Presenceは日本でいつ使える？SoftBank試験中で自己申込みは未対応

【速報】Claude Sonnet 5の性能や費用を解説【8月31日までAPI料金が安い！】

AIエージェントに何を任せるか最初の30日で切り出す仕事リスト

いま読まれている用語

まだそこまで読まれていない用語

一歩ずつ考えてから答える「推論モデル」

「手本なし」で考え方を身につけた

重みを公開し、誰でも使える

市場を揺らした「DeepSeekショック」

TopicAIが自分で「考え方」を発見した

DeepSeek-R1に関するよくある質問

OpenAI Presenceは日本でいつ使える？SoftBank試験中で自己申込みは未対応

【速報】Claude Sonnet 5の性能や費用を解説【8月31日までAPI料金が安い！】

AIエージェントに何を任せるか 最初の30日で切り出す仕事リスト

いま読まれている用語

まだそこまで読まれていない用語

AIエージェントに何を任せるか最初の30日で切り出す仕事リスト