CogVideoXはZhipuAI(智谱AI)が開発したオープンソースの動画生成AIです。5Bと2Bの2モデルが公開されており、一般的なGPU環境で高品質な動画を生成できます。本記事では特徴から使い方まで解説します。
実際にCogVideoX-5Bを試したところ、テキストへの忠実度が高く、指定した通りのシーンが精度よく生成される点が印象的でした。
CogVideoXとは?ZhipuAI開発のオープンソース動画AI
CogVideoX(コグビデオエックス)は2024年にZhipuAIが公開した動画生成モデルです。テキストから動画(T2V)を生成するモデルで、CogVideoX-5B(50億パラメータ)とCogVideoX-2B(20億パラメータ)の2種類があります。
主な特徴
- テキストプロンプトへの高い忠実度
- 720p相当の高品質動画生成
- Apache 2.0ライセンスで商用利用可能
- 5Bと2Bの2モデルで環境に応じた選択が可能
モデル比較
| モデル | パラメータ | 推奨VRAM | 特徴 |
|---|---|---|---|
| CogVideoX-5B | 50億 | 24GB | 高品質・高忠実度 |
| CogVideoX-2B | 20億 | 12GB | 軽量・高速 |
| CogVideoX 2.0 | 最新版 | 24GB | 改善版・最新機能 |
始め方
CogVideoXはComfyUIまたはHugging Face経由で利用できます。詳細な環境構築はCogVideoX-5Bローカル環境構築ガイドをご覧ください。
よくある質問(FAQ)
Q. CogVideoXは無料で使えますか?
A. はい。Apache 2.0ライセンスで無料公開されています。
Q. 日本語プロンプトは使えますか?
A. 英語プロンプトの方が精度が高いです。日本語→英語翻訳してから使用することを推奨します。
Q. 商用利用は可能ですか?
A. Apache 2.0ライセンスで商用利用可能です。
関連記事
\ この記事を読んだあなたにおすすめ /
🎁 AI動画ツール完全カタログ
PDF32ページ 無料プレゼント
Sora・Kling・Runway・Veo の最新活用法を32ページにまとめた
無料カタログ+AI診断アプリ付き

コメント