CNNとは

CNNとは、画像の認識を得意とするAIの仕組みで、ニューラルネットワークの一種です。日本語では「畳み込みニューラルネットワーク」と呼ばれます。写真に何が写っているかを見分ける技術の主役で、2012年にディープラーニングのブームに火をつけたAlexNetも、このCNNの一種でした。

どうやって画像を見分けるのか

CNNは、画像を一気に丸ごと見るのではなく、小さな窓で少しずつ走査して特徴を拾っていくのが特徴です。まず浅い段階で「線」や「模様」のような単純な特徴をつかみ、層が深まるにつれて「目」「タイヤ」といった部品、さらに「顔」「車」といった全体へと組み上げていきます。単純な手がかりを積み上げて、複雑なものを認識する。人がものを見るときの段階的な捉え方に近い、と考えるとわかりやすいでしょう。

画像認識の主役技術

CNNは、写真の分類や、医療画像から病変を見つける用途など、画像を扱うAIで広く使われてきました。ここで押さえたいのは、CNNはChatGPTのような対話AIが広まるより、ずっと前から活躍してきたということ。AIには文章を扱うものだけでなく、画像を見分けるものもあり、CNNはその中心を長く担ってきた技術です。

Topicブームの30年前から、手書き文字を読んでいた

CNNは2012年に突然生まれたわけではありません。1980年代末から90年代にかけて、研究者ヤン・ルカンが手書きの数字を読み取るCNN(LeNet)を実用化していました。郵便番号や数字を機械が読み取る、といった地道な用途で、AIブームのはるか前から働いていたのです。長く温められてきた技術が、データと計算機の進歩を得て2012年に一気に開花した、という積み重ねの物語があります。

CNNに関するよくある質問

CNNは何に使われるAIですか?
写真に何が写っているかを見分ける画像認識が主な用途で、写真の分類や、医療画像から病変を見つける作業などに広く使われてきました。2012年にディープラーニングのブームに火をつけたAlexNetも、このCNNの一種です。
CNNはどうやって画像を見分けるのですか?
画像を一気に見るのではなく、小さな窓で少しずつ走査して特徴を拾います。浅い段階で線や模様をつかみ、層が深まるにつれて「目」「タイヤ」といった部品、さらに「顔」「車」といった全体へと組み上げていく、人の見方に近い段階的な認識です。
CNNは最近の技術ですか?
いいえ。1980年代末から90年代に、研究者ヤン・ルカンが手書き数字を読み取るCNN(LeNet)を実用化していました。ChatGPTのような対話AIが広まるずっと前から、画像認識の中心を担ってきた技術です。