「SD 1.5では解像度が足りない」「LPやバナーに使える高品質な画像が欲しい」——Stable Diffusion XL(SDXL 1.0)はSD 1.5の解像度制限を突破しました。2023年7月にリリースされたSDXLは、ネイティブ1024×1024ピクセルの高解像度生成と、より自然な人物・テキスト・複雑シーンの描写を実現しています。
Stable Diffusionの全バージョン比較・最新情報はStable Diffusion完全ガイドをご覧ください。
Stable Diffusion XLの主な特徴
- ネイティブ1024×1024生成:SD 1.5の512pxから2倍のネイティブ解像度で高精細な出力が可能
- Base + Refinerの2ステージ:Baseモデルで構図生成→Refinerモデルで細部改善というパイプライン
- 人物・手の表現改善:SD 1.5での崩れが大幅に改善
- 画像内テキストの向上:英語テキストの描画精度が向上(完全ではないが実用的なレベルに)
- 8GB VRAM推奨:SD 1.5より要求スペックが上がるが、A100等クラウドGPUでも利用可能
ビジネスでの活用シーン
私が実際にSDXLでEコマース用商品ビジュアルを生成したところ、ネイティブ1024pxの高解像度でLPのファーストビューに直接使える品質の画像が得られました。撮影コスト(1カット3〜5万円)と比較すると圧倒的なコスト削減が可能です。
- LPファーストビュー画像:1024px以上の高解像度で直接使用可能なビジュアル
- 印刷物・A4チラシ用素材:高解像度出力でオフラインマーケ素材にも対応
- EC商品ビジュアル:商品を様々な背景・シーンに合成した素材量産
- 動画サムネイル:16:9アスペクト比での高品質サムネイル生成
Stable Diffusion XLの使い方
ComfyUIでSDXLを動かす
Hugging Face(stabilityai/stable-diffusion-xl-base-1.0)からBaseとRefinerの両モデルをダウンロードし、ComfyUIのcheckpointsフォルダに配置します。ComfyUIのSDXL用ワークフローをロードし、「SDXL」ノードでBaseとRefinerを順番に適用することで高品質な出力が得られます。
SDXL Turboで高速生成
SDXL Turbo(2023年11月)はSDXLをベースにした高速版で、1〜4ステップでの生成が可能です。品質を若干犠牲にしますが生成速度は10倍以上になるため、大量プロトタイプ作成時に有用です。
よくある質問
SDXLとSD 3.5はどちらが上ですか?
全体的な品質はSD 3.5の方が上です。SD 3.5ではアーキテクチャが刷新され(Transformerベース)、プロンプト追従・テキスト描画・一貫性が大幅に向上しています。ただしLoRAのエコシステムはまだSDXLの方が充実しており、特定スタイルが必要な場合はSDXLが実用的なケースがあります。
SDXLの最低GPU要件は?
SDXL BaseとRefiner両方を同時ロードするには8GB VRAM推奨です。6GB以下のGPUではBaseのみの使用か、4bit量子化版での動作となります。Google Colab(無料T4 GPU)でも動作させることが可能です。
関連記事
Stable Diffusion完全ガイド|全バージョン比較と最新機能
