ラベルとは

ラベルとは、AI学習させるデータに添えられた「正解」を示す情報のことです。たとえば動物の写真に「猫」と書き添えておくと、その「猫」がラベルにあたります。AIは、こうした正解付きのデータをたくさん見比べることで、写真と正解の結びつきを少しずつ覚えていきます。

特徴量と対になる「答え」

ラベルは、AIへの入力である特徴量と対になる存在です。特徴量がAIに与える「問題」だとすれば、ラベルはその「答え」にあたります。写真というデータ(特徴量)に「猫」という正解(ラベル)を組にしたものを、たくさん用意するわけです。

このように正解が付いたデータを使う学び方を、教師あり学習と呼びます。日常語のラベル(値札やシール)とは違い、ここでのラベルは「データに添えた正解」を指す点だけ押さえておくと、話がすっきりとつながるでしょう。

ラベルの質がAIの精度を決める

AIの賢さは、与えるラベルの正確さに大きく左右されます。間違った正解を教えれば、AIは間違ったまま覚えてしまう。データにラベルを付ける作業はアノテーションと呼ばれ、多くの場合は人の手で一つずつ行われます。

経営の視点でいえば、ここが見落とされがちなコスト要因です。質のよいラベル付きデータをどれだけそろえられるかが、自社でAIを育てるときの勝負どころになります。手元のデータをただ集めるだけでなく、正解をていねいに付けておくことが効いてきます。

TopicいまのAIブームは、約5万人の手作業から始まった

深層学習の火付け役になった画像データ集「ImageNet」は、気の遠くなるような人手で作られました。2008年から約2年かけ、167カ国の約49,000人が1,400万枚を超える画像に正解ラベルを付けたといわれます。この大量の正解データがあったからこそ、2012年に画像認識の精度が一気に跳ね上がり、いまのAIブームへとつながりました。華やかに見えるAIの裏側には、一枚一枚に「これは何か」を人が書き添えた地道な作業が積み上がっています。

ラベルに関するよくある質問

(AIの)ラベルとは何ですか?
AIに学習させるデータに添えられた「正解」を示す情報のことです。たとえば猫の写真に「猫」と書き添えておけば、その「猫」がラベルにあたります。値札やシールといった日常語のラベルとは違います。
ラベルと特徴量はどう違いますか?
特徴量がAIに与える「問題」だとすれば、ラベルはその「答え」にあたります。写真(特徴量)に「猫」という正解(ラベル)を組にしたものを使う学び方を教師あり学習と呼びます。
ラベルはAIの精度にどう影響しますか?
大きく左右します。間違った正解を教えればAIは間違ったまま覚えます。質のよいラベル付きデータをどれだけそろえられるかが、自社でAIを育てるときの勝負どころになります。