アノテーションとは

アノテーションとは、AI学習させるために、データへ「これは何か」という正解の情報(ラベル)を付ける作業です。写真に「これは犬」と書き込んだり、文章に「これは苦情」と印を付けたりして、AIが学べる教材を用意します。日本語では「ラベル付け」とも呼ばれ、AIの賢さを支える縁の下の工程です。

なぜ必要で、どんな作業なのか

正解つきのお手本から学ぶ教師あり学習では、良質なラベル付きデータがそろっているほど、AIの精度が上がります。アノテーションはその「正解」を用意する工程です。作業はさまざまで、画像に名前を付ける、写真の中の物を四角で囲む、文章の意味を分類するといった形があります。地味ですが、ここの質がAIの出来を大きく左右する、重要な下ごしらえです。

Topic自動運転の裏にある、気の遠くなる手作業

自動運転のAIに「車」「歩行者」「信号」を見分けさせるには、お手本が要ります。そのために、人が大量の映像を見ながら、映っている車や人を一つひとつ四角で囲んでいく作業が欠かせません。何万、何十万という画像に同じことを繰り返す、気の遠くなるような手仕事です。最先端のAIの華やかさの裏には、こうした根気強い人手の積み重ねがあります。

アノテーションに関するよくある質問

アノテーションとラベルは同じ意味ですか?
近い関係ですが、ラベルはデータに付ける「正解の情報」そのもの、アノテーションはそのラベルを付ける「作業」を指します。日本語ではアノテーションを「ラベル付け」とも呼びます。写真に「これは犬」と書き込むような、AIの教材を用意する工程です。
アノテーションはなぜAIの精度に関わるのですか?
正解つきのお手本から学ぶ教師あり学習では、良質なラベル付きデータがそろうほどAIの精度が上がるためです。地味な下ごしらえですが、ここの質がAIの出来を大きく左右します。
具体的にどんな作業をするのですか?
画像に名前を付ける、写真の中の物を四角で囲む、文章の意味を分類するといった形があります。自動運転では人が大量の映像を見ながら、映っている車や人を一つひとつ四角で囲む、気の遠くなる手作業が欠かせません。