教師なし学習とは

教師なし学習とは、正解(ラベル)のついていないデータから、AIが自分でパターンや規則性を見つけ出す機械学習の方法です。「これが正解」と教えずに大量のデータを与え、似たもの同士のかたまりや傾向を自力で探し当てさせます。正解つきのお手本で学ぶ教師あり学習と並ぶ、機械学習の代表的な学び方です。

教師あり学習との違い

2つの違いは、正解つきのデータが要るかどうかです。教師あり学習は人がラベルを用意する必要があり、手間とコストがかかります。教師なし学習は、ラベルのない生のデータをそのまま使えるのが強み。たとえば顧客を購買傾向ごとに自動でグループ分けする、ふだんと違う異常な動きを見つける、といった使い方が代表例です。「正解を教わって覚える」か「手がかりなしに傾向を見つける」か、と整理するとつかみやすいでしょう。

Topic巨大AIの賢さを支える「正解なしの学び」

ChatGPTのような大規模言語モデルがあれほど言葉に強いのは、教師なし学習の発想が土台にあるからです。人が正解を付けていないネット上の膨大な文章を読み込み、AIが自力で言葉のつながりや規則性をつかむ。この下地づくりがあるからこそ、巨大なAIを現実的な手間で育てられます。1つずつ正解を付ける作業がいらないぶん、桁違いの量のデータから学べるのが、教師なし学習の効いているところです。

教師なし学習に関するよくある質問

教師あり学習とどう違いますか?
正解つきのデータが要るかどうかが違いです。教師あり学習は人がラベルを用意する必要がありますが、教師なし学習はラベルのない生のデータをそのまま使えます。顧客を購買傾向ごとに自動でグループ分けする、ふだんと違う異常な動きを見つける、といった使い方が代表例です。
教師なし学習は大規模言語モデルと関係がありますか?
あります。ChatGPTのような大規模言語モデルが言葉に強いのは、教師なし学習の発想が土台にあるからです。人が正解を付けていないネット上の膨大な文章を読み込み、AIが自力で言葉のつながりをつかむことで、1つずつ正解を付ける作業なしに桁違いの量のデータから学べます。