Sora 画像生成 機能について、この記事では解説していきます。
Sora 画像生成 とは?
Soraでもついに、画像生成機能(I2V)が利用可能になりました。I2VとはImag to Video(画像から動画生成)の意味です。2025年3月下旬、ChatGPTで画像生成に関する大規模なアップデートが行われ、ジブリ風の画像が作れるようになって盛り上がりましたね。これに伴い、Soraでも画像から動画を生み出す「I2V」機能を中心に、画像生成の精度や操作性が大きく向上しました。
公式サイトの例

ChatGPTの画像生成機能の使い方
ChatGPTの画像生成は従来の「DALL-E 3」が担ってきました。しかし今回は、GPT-4ベースの高精度な画像生成機能がChatGPT内に新たに搭載されました。この新機能は、Soraにも一部取り入れられています。
特にSoraでは、画像生成から動画変換までを一貫して行えるのが大きな特徴です。
主な機能には以下のようなものがあります。
- アスペクト比の選択(3:2、1:1、2:3など)
- 多彩なスタイルの切り替え
- ページ単位の漫画出力やLINEスタンプ風のバリエーション生成
- 実写風のホワイトボードシーン
- PowerPoint向けのチャートや図解の出力
- I2V(Image-to-Video):画像から自然なアニメーションを生成
T2I(画像生成)機能の強化
画像の品質
まず、画像生成の精度が大幅にアップされています。たとえば、アニメ風・イラスト風・漫画風といったスタイルの変換が非常に滑らかです。構図や背景を保ったまま自然に切り替えができます。
さらに、また、参照画像を使った「I2I(Image-to-Image)」変換も可能になりました。そして、入力画像の特徴を活かしながらスタイルチェンジが可能です。
日本語の出力
また、日本語テキストの表現力も強化されています。また、キャッチコピー入りの広告やYouTubeサムネイルなどで日本語が入った画像生成も高精度に生成可能です。
マルチターン
ChatGPTの得意とするマルチターン(対話形式)の強化も大きいです。例えば、「帽子の色だけを変更」など細かい指示も的確に反映されます。
I2V(画像から動画生成)機能の強化
Sora上では、ChatGPTで生成した画像を使って動画を作る「I2V」機能が強化されています。例えば、スタイルは日本のアニメ風、昭和漫画風、水彩画風、3Dアニメ風、Minecraft風など多彩です。

さらに、動作の指示(例:”They are sleeping”)をプロンプトで与えることで、より自然な動画に仕上がります。

RemixとCreate Video(SoraI2V)の使い分け
現在、Soraには以下の2つの編集モードがあります。
- Remix(I2I):画像の一部を選択してスタイルや要素を変更
- Create Video(I2V):画像をもとに動画化。動きを加えてアニメーションを生成
たとえば、猫を犬に変える場合、リミックスモードでは該当部分をペイントしてみましょう。「この猫を犬にしてください」といった直感的な操作が可能です。Create Videoではアスペクト比が変更される場合もあるため、事前確認が必要です。
注意事項
「ジブリ風」「ピクサースタイル」など著作権に関わる表現は避けましょう。つまり、「日本のアニメ風」「3Dアニメ風」といった一般化された表現を使うのが安全になります。Soraではこれらのスタイルも高精度で再現されることが多いです。なので、表現の幅は十分に広がっています。
おすすめのワークフロー:ChatGPT + SoraI2V
現在の僕個人の最適な使い方は、以下の流れです。
- ChatGPTで高精度な画像を生成
- マルチターン対話で細かく修正
- 完成した画像をSoraにアップロード
- SoraI2V機能で動画に変換
Soraの便利な編集機能も活用しつつ、最初の画像作成はChatGPTで行うのが効率的です。他にも、リミックスや動画化への切り替えもスムーズに行えます。これにより、より自由な表現が可能になります。