ファインチューニングとは

ファインチューニングとは、すでに学習を終えたモデルに追加の訓練を施し、特定の用途向けに「微調整」する手法です。英語のfine-tuningが名前の由来。ゼロから作り直すのではなく、できあがったモデルに専門のデータで追加レッスンを受けさせ、専門性を後付けするイメージです

プロンプトエンジニアリングとの違い

よく似た言葉にプロンプトエンジニアリングがあります。こちらはモデルに手を加えず、頼み方を工夫して望む答えを引き出すやり方。その場の工夫で動かすのがプロンプトなら、ファインチューニングはモデルそのものを訓練して中身を作り変える点が決定的に違います。一度仕込めば、毎回くわしく指示しなくても狙った受け答えをしやすくなる反面、学習データの用意や検証という手間もつきもの。

ビジネスでの使いどころ

多くの場面は、実はプロンプトの工夫だけでも十分にまかなえます。ファインチューニングが効くのは、出力の形式をいつも揃えたいときや、大量に処理してコストを抑えたいとき。専門用語の多い業界文書や、自社らしい言い回しを安定して出したい場合にも向いています。一方でデータ準備や検証に手間がかかるため、まずはプロンプトで試し、物足りなければ検討するのが現実的でしょう。

TopicChatGPTが指示に素直なのは微調整のおかげ

大量の文章を学んだだけのAIは、賢くても受け答えのお行儀はいまひとつ。そこで、人間が「この答えは良い・これは良くない」と評価しながらモデルを微調整するRLHF(人間のフィードバックによる強化学習という手法が使われます。ChatGPTのように、こちらの指示へ素直に沿って答えてくれる振る舞いは、こうした微調整で整えられたもの。賢さと「お行儀のよさ」は、別々に仕込まれているのです。

ファインチューニングに関するよくある質問

ChatGPTが指示に素直に答えてくれるのは、なぜですか?
大量の文章を学んだだけのAIは、賢くても受け答えのお行儀はいまひとつです。そこで人間が「この答えは良い・良くない」と評価しながらモデルを微調整するRLHF(人間のフィードバックによる強化学習)が使われます。ChatGPTのように指示へ素直に沿う振る舞いは、こうしたファインチューニングで整えられたもので、賢さとお行儀のよさは別々に仕込まれています。
プロンプトエンジニアリングとの違いは?
プロンプトエンジニアリングはモデルに手を加えず、頼み方の工夫で答えを引き出します。ファインチューニングはモデルそのものを訓練して中身を作り変える点が決定的に違います。
どんなときにファインチューニングが必要ですか?
多くの場面はプロンプトの工夫で十分です。出力の形式をいつも揃えたいとき、大量に処理してコストを抑えたいとき、自社らしい言い回しを安定して出したいときなどに効きます。まずプロンプトで試し、物足りなければ検討するのが現実的です。