Veo3とは 、テキストや画像から1分を超える高画質(1080p)でリアルな動画を生成できる、Googleの最先端の動画生成AIです。
5月下旬あたりから上のようなショート動画が流行っていますよね。 #veo3 とタグがついている通り、Veo3で作られた映像です。
動画のポイントにもなりますが、超リアルな効果音がつけられるのがVeo3の大きな強みです。
4大動画生成AIである「 Sora 」「 Veo 」「 Runway 」「 Kling 」のうちの一つです。映像制作者などプロのクリエイター向けに設計されており、指示に対する高い忠実性と、映像の一貫性を保つ能力が特徴です。
Veoの概要

Google Veo3 は、Googleが開発している動画生成AIモデル「 Veo 」の3つ目となるモデルです。
2024年5月に開催されたGoogle I/Oで発表された、同社の最も高性能な動画生成モデルとなっています。OpenAIの「Sora」の競合と位置付けられており、リアルな人物や動物、風景から、タイムラプスや空撮といった特定の映像技法まで、幅広いスタイルの動画を生成できます。
今後YouTube ShortsなどのGoogle製品への統合が予定されています。YoutubeはGoogleの傘下なので、今後動画生成AIの普及が加速していきそうですね。
Veo3 の主な機能
Veo3 の主な機能は以下の通り7つです。これは公式で発表されている分類ではありませんが、それなりに1年ほど動画生成AIを研究している僕が体系的にまとめた分類です。
入力 | 機能 | 概要 |
T2V Text to Video | Audio機能 | 動画の内容をAIが解釈し、それぞれに適した音を自動で生成・追加します。 |
Camera機能 | あらかじめ用意された全13パターンのカメラワークから選ぶだけで、動画に本格的な動きを加えられる機能です。 | |
I2V Image to Video | Keyframe機能 | 特定の画像を開始点や終了点として指定することで、動画の展開をより細かくコントロールできます。 |
Ingredients機能 | 複数の画像や特定のスタイルを「素材」として動画生成に活用します。 | |
V2V Video to Video | Scenebuilder機能 | 個別に生成した複数の動画クリップをタイムライン上でつなぎ合わせます。 |
Jump to機能 | 既存の動画クリップのキャラクターや世界観はそのままに、全く新しい別のシーンを生成する機能です。 | |
Extend機能 | 既存の動画クリップの自然な「続き」をAIに生成させることで、シーンを長く延長するためのものです。 |
動画生成AIでできること、つまり各機能を取りこぼしなく理解するためにはこのように知識を一度まとめて体系的に理解していくことが重要です。そうすると、例えば、I2Vの中のIngredients機能は Kling の中の Elements機能 みたいなものだな、とかだんだん点が繋がってきてあなた自身の動画生成AIスキルも上がっていきます。
これから上記の機能について各記事でまとめていきますのでお楽しみに。