「SDXLを超える品質のローカル画像生成AIが欲しい」「プロンプト通りのテキスト描画ができる画像生成AIを使いたい」——Stable Diffusion 3.5(SD 3.5)はそれらの要求に応えるStability AIの最新フラグシップモデルです。2024年10月にリリースされたSD 3.5は、UNetからTransformer(Rectified Flow Transformer)へのアーキテクチャ刷新により、画像品質・プロンプト追従・テキスト描画のすべてが従来バージョンを大きく上回ります。
Stable Diffusionの全バージョン比較・最新情報はStable Diffusion完全ガイドをご覧ください。
Stable Diffusion 3.5の主な特徴
- Transformerベースの新アーキテクチャ:Rectified Flow Transformerにより生成品質が飛躍的に向上
- SD 3.5 Large / Medium / Large Turbo:用途別に3モデルを展開。Largeが最高品質、Mediumが8GB GPU向け
- テキスト描画の大幅向上:画像内の英語テキストを高精度で描画。広告バナー生成に実用的
- 複雑なプロンプトへの対応:多要素の複雑な指示を高精度で再現
- オープンウェイト公開:Hugging Faceで無料ダウンロード・商用利用可能
ビジネスでの活用シーン
私が実際にSD 3.5 Mediumで「白背景、プロダクト写真、コスメボトル、柔らかいスタジオライティング」を生成したところ、ECサイトのメイン商品画像として使えるレベルのクオリティが得られました。SD 3.5はオープンソースでありながらMidjourneyやDALL-E 3に匹敵する品質を実現しています。
- EC商品画像:白背景・生活シーン・アンビエント素材を高品質で量産
- テキスト入りバナー:英語のタグラインを画像内に直接描画(修正省力化)
- 広告ビジュアル候補の大量生成:コンセプト検討フェーズで複数バリエーションを高速生成
- コンセプトアート・製品デザイン可視化:新商品・新サービスのビジュアライゼーション
Stable Diffusion 3.5の使い方
ComfyUIでのセットアップ
Hugging Face(stabilityai/stable-diffusion-3.5-medium または stable-diffusion-3.5-large)からモデルをダウンロードします。ComfyUIでSD3.5対応のワークフローをインポートし、checkpointsフォルダにモデルを配置することで使用できます。SD 3.5 Mediumは8GB VRAM、Largeは16GB以上を推奨します。
クラウドサービスでの利用
ローカルGPUが不足する場合、Stability AI APIやReplicate経由でSD 3.5を使用できます。APIを使うとビジネスの画像生成パイプラインに組み込み、自動で商品画像・SNS素材を量産するワークフローを構築できます。
よくある質問
SD 3.5とSDXLはどちらが上ですか?
全体的な品質・プロンプト精度・テキスト描画のすべてでSD 3.5がSDXLを上回ります。ただしLoRAなどのファインチューニングモデルのエコシステムはまだSDXLの方が成熟しています。
SD 3.5の商用利用条件は?
Stability AI非商用ライセンスとStability AI Community Licenseの2種類があります。年間収益が100万ドル以下の事業者はCommunity Licenseで商用利用が可能です。大規模商用利用にはEnterprise Licenseが必要です。
関連記事
Stable Diffusion完全ガイド|全バージョン比較と最新機能
