対照学習とは

対照学習とは、データを「似たものどうしは近くに、違うものは遠くに」配置するよう、AIに表現の仕方を学ばせる手法です。人が一つひとつ正解ラベルを付けなくても、大量のデータから「何が似ていて何が違うか」をつかめるのが特長で、近年のAIが言葉や画像の意味を扱う土台の一つになっています。

「仲間」と「他人」を見分けて学ぶ

仕組みはシンプル。たとえば1枚の写真を切り取り方や色味を変えて2通りに加工し、この2枚は「仲間(正例)」、まったく別の写真は「他人(負例)」だとAIに教えます。AIは仲間どうしを数値の地図の上で近づけ、他人を遠ざけるよう学習を繰り返す。これを膨大な組み合わせでこなすうちに、正解ラベルなしでも「意味の近さ」を捉えた特徴が育っていきます。人手のラベル付けに頼らないので、自己教師あり学習と呼ばれる仲間に入ります。

検索・推薦・マルチモーダルを支える

では、何の役に立つのでしょうか。対照学習で作った特徴は、意味で探すベクトル検索や、好みに合わせる推薦の精度を支えます。画像と文章を同じ地図の上に並べて結びつけるCLIPのような仕組みも、対照学習の考え方で作られました。ラベル付けのコストを抑えつつ、データから直接「意味のものさし」を作れる。ここが、AIを業務に取り入れたい立場から見た価値でしょう。

Topicラベルなしで、ラベルありに並んだ瞬間

対照学習が一気に注目された転機が、Googleが2020年に公開したSimCLRです。正解ラベルを一切使わずに学んだ特徴が、画像認識の定番テストでラベルあり学習の代表モデルに匹敵する精度(約76.5%)を出しました。ChatGPTの一般公開(2022年11月30日)より前の出来事で、「正解を与えなくても賢く学べる」という流れを後押しした研究です。

対照学習に関するよくある質問

対照学習と教師あり学習は何が違いますか?
教師あり学習は人が付けた正解ラベルを手本にしますが、対照学習はラベルなしでデータどうしの似ている・違うの関係から学びます。ラベル付けの手間を大きく省ける点が違いです。
対照学習は画像にしか使えないのですか?
いいえ。起点となった研究は音声・画像・テキストなど複数の分野で示され、現在は文章の意味検索やマルチモーダルなど幅広く使われています。
「負例(他人)」がないと学習できないのですか?
標準的な対照学習は、近づける仲間と遠ざける他人を対比させて学ぶため負例が重要な役割を持ちます。狙いは、似たものだけでなく違うものとの距離も同時に学ぶことにあります。

あわせて読みたい記事