Veoとは

Veoとは、Googleが開発する動画生成AIのことです。文章や画像で指示を出すと、それに合った動画を作り出します。2024年に発表され、OpenAISoraなどと並ぶ、動画生成AIの代表的なモデルのひとつです。

映像と音声を一緒に生み出す

Veoの特徴は、映像だけでなく、それに合う音声まで同時に作れる点にあります。多くの動画生成AIが無音の映像を作るなか、Veoは2025年のVeo 3で音声生成に対応しました。テキストから動画、画像から動画、最大4Kの高画質出力、カメラワークの指定など、作り込みのための機能も幅広く備えています。GeminiやそのAPIを通じて利用できます。

Topic「映像が音と出会った」とGoogleは表現した

動画生成AIの多くは、長らく「音のない映像」を作るのが基本でした。そこにVeoは、映像とぴったり合う音声を同時に生成する機能を加えています。Googleはこれを「映像が、音声と出会う」と表現しました。動く絵に音が重なることで、生成された動画はぐっと現実味を増します。動画生成AIが「無声映画」から一歩進んだ瞬間ともいえます。

Veoに関するよくある質問

Veoは動画に音声も付けられますか?
はい。多くの動画生成AIが無音の映像を作るなか、Veoは2025年のVeo 3で、映像にぴったり合う音声まで同時に生成できるようになりました。Googleはこれを「映像が、音声と出会う」と表現しており、動画生成AIが「無声映画」から一歩進んだ機能といえます。
Veoはどこで使えますか?
GoogleのGeminiやそのAPIを通じて利用できます。文章から動画、画像から動画、最大4Kの高画質出力、カメラワークの指定など、作り込みのための機能も幅広く備えています。