AI CM についてこの記事では解説しています。
近年、AI技術の進化は目覚ましく、特に動画生成AIの登場はクリエイティブ業界に大きな衝撃を与えています。かつては専門的な知識や高価な機材、そして多くの時間が必要だったCM制作も、今やAIを使えば誰でも手軽に挑戦できる時代になりました。
この記事では、実際にAIを駆使して架空の企業の「AI CM」をゼロから制作するプロセスをレポートします。企画の骨子作りには対話型AIの「ChatGPT」を、そして映像生成には「Sora」のような動画生成AIを活用。AIならではの無限の可能性と、向き合うべき課題の両面を、実践を通して探っていきます。
STEP1:企画立案 – ChatGPTとCMのコンセプトを練る
CM制作の第一歩は、企画とコンセプトの策定です。今回は、架空のインフラ建設会社「ミナトインフラホールディングス」の30秒ブランディングCMを制作するという設定でスタートしました。
まず、この架空企業の詳細な設定をChatGPTに伝えます。
- 企業名: ミナトインフラホールディングス
- 事業内容: インフラ建設
- 企業理念: 「人が集う場所を、100年先まで。」社会基盤の整備を通じて人々の暮らしを支え、次世代に誇れるインフラを提供する。
これらの情報に基づき、30秒のCM案を考えるようChatGPTに指示。すると、数秒で具体的なシーン構成とナレーションを含んだ絵コンテが提案されました。しかし、AIが最初に提案する内容は、時に複雑すぎる場合があります。動画生成AIは、一つのシーンに多くの要素(人、物、背景、動きなど)を詰め込みすぎると、意図しない映像(破綻した映像)を生成してしまう傾向があります。
そこで、「各カットの映像は、一言で表現できるくらいシンプルに」 という追加の指示を与え、AIと対話を繰り返しながらCM案をブラッシュアップ。この「AIとの共同作業」こそが、質の高いAI CM制作の鍵となります。最終的に、各シーンを生成するための簡潔で的確な指示(プロンプト)が完成しました。
STEP2:映像生成 – 動画生成AIでアイデアをカタチにする
企画が固まったら、いよいよ映像生成のフェーズです。ChatGPTが作成したプロンプトを、動画生成AIに入力し、CMの各シーンを具現化していきます。
成功シーン:「朝の都市」と「家族の団らん」
最初のシーンは「日本の都市がゆっくりと目覚める、朝焼けのシーン」。このプロンプトから、AIは息をのむほど美しい都市の夜明けの映像を複数パターン生成してくれました。高層ビルの間から朝日が差し込み、街全体が柔らかい光に包まれていく様子は、まさにCMの冒頭にふさわしい品質です。
続く「家族が食卓を囲む団らんのシーン」でも、温かく幸せな雰囲気が伝わる高品質な映像が生成されました。複数の候補の中から、最も企業理念に近い、穏やかで自然な雰囲気の映像を選択。ここまでは、AIの能力に驚かされる、順調な滑り出しでした。
直面した壁:「地震」シーンの生成とAIの制約
しかし、制作はすぐに大きな壁にぶつかります。CMのストーリー上、インフラの重要性を表現するために「地震が発生し、家族が不安になる」というシーンを入れ込む予定でした。
ところが、「地震に揺れる家」というプロンプトを入力しても、AIは全く揺れていない日常の映像しか生成しません。何度か言葉を変えて試しても、結果は同じでした。
これは、動画生成AIに内在する倫理的な制約や安全機能が関係していると考えられます。フェイクニュースや偽情報の拡散を防ぐため、自然災害や事故、争いといったネガティブ、あるいは社会的に影響の大きい事象の映像は、意図的に生成されにくくなっている可能性があります。
AIでCMを作るということは、単に技術を使うだけでなく、こうしたAIの「個性」や「ルール」を理解し、どう付き合っていくかを考えることでもあります。この予期せぬ壁に、私たちは方針転換を迫られることになりました。
STEP3:方向転換と再挑戦 – AIの制約を創造のバネにする
前半の記事で触れた通り、私たちの「AI CM」制作は「地震のシーンが生成できない」という予期せぬ壁にぶつかりました。AIの倫理的・技術的な制約の前で、当初の企画案は行き詰まりを見せます。
しかし、ここで思考を停止させてはAIとの共同作業は成り立ちません。重要なのは、AIの制約を「できない理由」として嘆くのではなく、「新しいアイデアを生むための創造的な制約」と捉え直すことです。
私たちは原点に立ち返り、このCMで本当に伝えたかったメッセージを再確認しました。それは「災害の恐怖」ではなく、その先にある「暮らしの安心感」です。そこで、地震という直接的な表現を避け、企業の技術力によってもたらされる「未来の家の安全性と快適性」を象徴的に描く方向へと大きく舵を切りました。
具体的には、当初の企業設定にあった「IoT家電対応の未来型住宅」という要素を前面に押し出し、「リビングルームにある未来的なスイッチを、住人が指先でそっと操作する」というシーンに差し替えることを決定。このワンシーンで、企業の先進性と、住民に提供するスマートで安心な暮らしの両方を表現する狙いです。
STEP4:プロンプトの深化 – AIとの対話を極める
新しいシーンの方向性が決まれば、再びAIとの対話です。しかし、ここでも一筋縄ではいきませんでした。
例えば、「日本のリビングルームでスイッチを押す女性」というプロンプトをそのまま入力すると、AIはなぜか「和室」や「着物を着た女性」といった、やや古風なイメージの映像を生成しがちでした。これはAIが学習したデータの中で、「日本家屋=和室」という固定観念が強く結びついているためと考えられます。
このAIの”クセ”を読み解き、私たちはプロンプトに一工夫加えました。主語を「場所」から「人」に変え、「未来的なリビングルームで、”日本人女性”がスイッチを操作する」と指示したのです。
このわずかな違いで、AIが生成する映像は劇的に変化しました。背景はモダンで洗練された空間を保ちつつ、登場人物が日本人であることで、日本の企業のCMとしての説得力を持たせることに成功したのです。このように、AIの思考の傾向を予測し、言葉を巧みに使い分けることが、質の高いAI CM制作には不可欠です。
この要領で、「夕暮れの庭に人々が集い、談笑するシーン」やCMの締めとなる「夜の都市の美しい空撮」といった他のカットも次々と生成していきました。
STEP5:編集と仕上げ – AIと人間の最終共同作業
全ての映像素材が揃ったら、最終工程である「編集」に入ります。AIが生成したのはあくまで数秒間の動画クリップの断片。これらを30秒のCMとして意味のある一つの物語に紡ぎ上げるのは、人間のクリエイターの役割です。
動画編集ソフトを使い、生成された膨大なクリップの中から最もイメージに近いものを厳選し、カットをつなぎ合わせていきます。全体のテンポを整え、視聴者の感情に訴えかけるBGMを選曲し、最後にAI音声で作成したナレーションを乗せていきます。
素材を生み出すのはAI、そしてその素材を調理し、最終的な一皿に仕上げるのは人間。この最終段階において、AIと人間の創造性が見事に融合し、一本のCMが完成へと向かいます。
完成した「AI CM」と、その先に広がる可能性
こうして完成したCMがこちらです。
- 静かな朝の光が差し込む都市の風景から始まり、家の中で母親が子供に絵本を読み聞かせる穏やかな日常が映し出される。
- シーンは一転し、女性が未来的なタッチパネルに触れると、家全体がスマートに制御される様子が描かれる。
- 夕暮れ時、人々が家の前で楽しそうに語らう。コミュニティの温かさが伝わってくる。
- 最後は、煌めく夜景をバックに「人が集う場所を、100年先まで。ミナトインフラ」という企業メッセージで締めくくられる。
当初の「地震」というアイデアからは大きく変わりましたが、AIとの試行錯誤の末、企業の先進性と「安心で豊かな暮らし」というテーマをより洗練された形で表現した作品に着地しました。
今回の挑戦を通して見えてきたのは、AI CM制作の成否を分けるのは、もはや高価な機材や専門知識だけではないということです。最も重要なのは、AIの能力と限界を深く理解し、粘り強く対話し続ける力、そして予期せぬ制約すらもアイデアの源泉に変えてしまう柔軟な創造性でした。
AIがCMを作る時代は、もう始まっています。それは単なる自動化ではなく、人間のクリエイティビティを拡張する、新たな冒険の始まりなのかもしれません。