用語 基本

画像生成AIとは

画像生成AIとは、言葉で指示するだけで、それに合った画像を作り出すAIです。「夕暮れの海辺を走る犬」と打ち込めば、その情景の絵や写真のような画像が出てくる、という具合。文章から絵を起こす(テキストから画像生成)のが基本で、広告やデザイン、企画のたたき台づくりなどで活用が広がっています。

どんな仕組みで作るのか

画像生成AIを支えているのは、大量の「画像とその説明文」のセットから学んだ、言葉と見た目の対応です。近年の主流は「拡散モデル」と呼ばれる方式で、ノイズだらけの状態から少しずつ絵を整えていくように画像を作ります。かつては偽物そっくりを作るGANという技術もよく使われました。代表的なサービスにDALL·EMidjourneyStable DiffusionAdobe Fireflyなどがあります。

2022年に一気に広まった

画像生成AIが世間の話題をさらったのは2022年のことでした。文章を扱うChatGPTが広まったのとほぼ同じ時期に、絵を作るAIも一般に知られるようになった、と捉えると流れがつかめます。ただし研究自体はそれ以前から続いており、ある日いきなり完成したわけではありません。

Topicほんの数年で、粗い点描から写真並みへ

今でこそ写真と見分けがつかない画像を作れますが、出発点はささやかなものでした。2015年の初期の画像生成AIが作れたのは、わずか32×32ピクセルの粗くて小さな画像。それが2022年頃には、写真や手描きの絵に迫る品質まで一気に進化しました。たった数年での激変ぶりは、AIの進歩の速さを物語っています。少し前の「できない」が、あっという間に「当たり前」に変わる。それがこの分野の怖さでもあり、面白さでもあります。

画像生成AIに関するよくある質問

画像生成AIはどれくらいのスピードで進化したのですか?
2015年の初期の画像生成AIが作れたのは、わずか32×32ピクセルの粗くて小さな画像でした。それが2022年頃には写真や手描きの絵に迫る品質まで一気に進化しています。たった数年での激変ぶりは、AIの進歩の速さを物語っています。
画像生成AIはどんな仕組みで作るのですか?
大量の「画像とその説明文」のセットから学んだ言葉と見た目の対応をもとにします。近年の主流は「拡散モデル」で、ノイズだらけの状態から少しずつ絵を整えます。代表例にDALL·E、Midjourney、Stable Diffusion、Adobe Fireflyがあります。
画像生成AIはいつ広まったのですか?
2022年です。文章を扱うChatGPTが広まったのとほぼ同じ時期に、絵を作るAIも一般に知られるようになりました。ただし研究自体はそれ以前から続いていました。