教師なし学習とは
教師なし学習とは、正解(ラベル)のついていないデータから、AIが自分でパターンや規則性を見つけ出す機械学習の方法です。「これが正解」と教えずに大量のデータを与え、似たもの同士のかたまりや傾向を自力で探し当てさせます。正解つきのお手本で学ぶ教師あり学習と並ぶ、機械学習の代表的な学び方です。
教師あり学習との違い
2つの違いは、正解つきのデータが要るかどうかです。教師あり学習は人がラベルを用意する必要があり、手間とコストがかかります。教師なし学習は、ラベルのない生のデータをそのまま使えるのが強み。たとえば顧客を購買傾向ごとに自動でグループ分けする、ふだんと違う異常な動きを見つける、といった使い方が代表例です。「正解を教わって覚える」か「手がかりなしに傾向を見つける」か、と整理するとつかみやすいでしょう。
Topic巨大AIの賢さを支える「正解なしの学び」
関連用語
教師なし学習に関するよくある質問
- 教師あり学習とどう違いますか?
- 正解つきのデータが要るかどうかが違いです。教師あり学習は人がラベルを用意する必要がありますが、教師なし学習はラベルのない生のデータをそのまま使えます。顧客を購買傾向ごとに自動でグループ分けする、ふだんと違う異常な動きを見つける、といった使い方が代表例です。
- 教師なし学習は大規模言語モデルと関係がありますか?
- あります。ChatGPTのような大規模言語モデルが言葉に強いのは、教師なし学習の発想が土台にあるからです。人が正解を付けていないネット上の膨大な文章を読み込み、AIが自力で言葉のつながりをつかむことで、1つずつ正解を付ける作業なしに桁違いの量のデータから学べます。