KOLORS2.0について、今回は見ていきます。、Kling 2.0の大幅アップデートのうち、3つある主要な更新の中から、2つ目にあたるのが、「画像生成機能」です。
Kling 2.0では、以下の3つの機能が大きくアップデートされました:
- マスター動画生成機能(動画生成機能の強化)
- KOLORS2.0 (画像生成機能の強化)
- マルチモデル対応の編集機能
なお、1つ目の動画生成機能に関する大幅なアップデートについては、コチラの記事で紹介していますので、まだご覧になっていない方はぜひそちらもチェックしてみてください。
Kolors2.0 の主なアップデートポイント(3つ)
こちらは公式リリース情報をもとに紹介しています。なお、一部Google翻訳を使用しているため、不自然な日本語が含まれている箇所もありますが、ご了承ください。
Kolors2.0 とは?
画像生成のために新たに登場した機能で、以下の点が大きく改善されています:
- プロンプトの順守性が大幅に向上
→ より細かい指示に忠実な画像生成が可能になりました。 - 映画的でリアルなビジュアルの実現
→ 見た目がより映画のようで、現実味のある仕上がりになります。 - 60以上のスタイルに対応した多様なビジュアル表現
→ より多くのスタイルから選べることで、表現の幅が広がりました。
①プロンプトの順守性が大幅に向上
まずは、アップデートの1つ目「プロンプト順守の大幅な改善」から見ていきましょう。
今回のアップデートによって、複雑なプロンプトへの対応力が大きく向上し、出力される画像がよりリアルで現実的に、そして他と差別化された使いやすいものになりました。
つまり、より細かく具体的なプロンプトを入力すれば、それに忠実な画像が生成されるようになったということです。
たとえば今回の例では、次のような非常に詳細なプロンプトにもしっかり対応できています:
プロンプト)
リビングルームの壁に掛けられた油絵から川が流れ出し、ソファーやフローリングに水が流れ落ちている。絵には静かな山間の川が描かれ、水面を優雅に流れる小舟が、まるで現実に溶け込むようにリビングルームへと入り込んでいる。川の流れはフローリングに広がり、芸術と現実が融合している様子を表現。リビングルームはエレガントな家具で装飾されており、まるで映画や写真から飛び出してきたかのような、温かく居心地の良い雰囲気を醸し出している。
1.5 で作成

2.0 で作成

今回はKOLORS2.0 と、一世代前の1.5を、同じプロンプトで比較してみたいと思います。
比較に使用するのは、先ほど紹介した以下の3つのプロンプトです。公式リリース情報に掲載されていた実際のプロンプトを使用しています。
モデルについて
現在、「Standardモデル」と「High-res(高解像度)モデル」が用意されています。
※明記されていませんが、High-resは高解像度&高応答の意味合いで、出力スピードと品質が高いと推測されます。なお、StandardとHigh-resでクレジット消費量は同じです。
実際の比較
それでは、同一プロンプトでそれぞれ生成された画像を見てみましょう。
- 左側:KOLORS1.5 で生成した画像
- 右側:KOLORS2.0 で生成した画像(公式による生成)
一見すると、1.5と2.0どちらもクオリティが高く、好みによって評価が分かれそうな印象を受けます。
しかし、KOLORSの本当の進化ポイントは「見た目の美しさ」ではなく、「プロンプトへの忠実度」にあります。
つまり、どれだけプロンプトの指示通りに画像を生成しているかが、注目すべき違いです。
- 1.5 :
→ 川はフローリングには流れ落ちていますが、ソファーには流れていません。 - 2.0 :
→ フローリングとソファーの両方に川が流れている描写がしっかり反映されています。
また、
- 「静かな山間の川」や「水面を流れる小舟」については、どちらも表現できている印象です。
- 「エレガントな家具」や「温かく居心地の良い雰囲気」については、2.0の方が光と影の表現が豊かで、雰囲気が強く出ていると感じられます。
このように、2.0 ではプロンプトの細かいニュアンスをより忠実に反映できるようになっています。
これが、アップデートの1つ目「プロンプト順守の大幅な改善」を裏付ける具体例になります。
②映画的でリアルなビジュアルの実現
続いて、2つ目のアップデートポイントは「映画的なクオリティの向上」です。
今回のアップデートによって、構図や色調の深みが増し、生成される画像がまるで映画のワンシーンのようなビジュアルに進化しました。構図の正確さや奥行き、色彩表現によって、ストーリーボードの表現力がまさに新たなレベルに到達したといえます。
さらに注目すべきは、複雑なプロンプトだけでなく、短い1行程度のシンプルなプロンプトでも、高品質な画像が生成できる点です。
一見すると、「細かく書けばその通りに作れる」という1つ目のポイントと矛盾するようにも思えますが、実はどんなレベルのプロンプトでも、その意図を最大限に汲み取って出力できる柔軟性と性能が備わってきているということです。
つまり2.0になったことで、画像生成の“出力の最大値”が底上げされたという感覚に近いですね。
たとえば今回の事例では:
プロンプト)
白いテーブルが並べられた宴会場で、美味しい食事を楽しむ人々で賑わっているシーン
1.5 で作成

2.0 で作成

このようなごくシンプルな描写にもかかわらず、実際の会合を写したかのようなリアリティあるビジュアルを出力できるのです。登場する人物も場所もすべて架空であるにも関わらず、そうとは思えないほど自然な画像が生成される、というのがこの2つ目のアップデートの凄さです。
こちらも左側が1.5、右側が2.0の出力結果になります。
まず、ここでもアップデートの1つ目「プロンプト順守の向上」が関係してきます。
このプロンプトに対して、1.5の画像では人物が登場しておらず、空間だけが表現されているのに対し、2.0では人々がしっかり描かれており、プロンプト通りに忠実な出力がされているのがわかります。
さらに、アップデートの2つ目「映画的なクオリティの向上」という観点でも違いが見られます。
1.5では自然光に近いナチュラルな照明が使われているのに対し、2.0では映画のような照明効果が加えられ、色調や陰影に深みがあり、独特の雰囲気が生まれています。
③60以上のスタイルに対応した多様なビジュアル表現
そして、最後となる3つ目のアップデートポイントは「様式化(多様なスタイル表現への対応)」です。
今回のアップデートにより、特殊なテクスチャ、デジタルアート、さまざまな描画技法など、60種類以上のスタイルに対応できるようになりました。
その結果、独自のスタイルや、既存スタイルを組み合わせた新しい表現もプロンプト次第で実現可能です。
たとえば以下のようなプロンプトでも、非常に独特な世界観を持つ画像が生成されます:
唐代の衣装をまとった少女・Lin Daiyuが、喫茶店の片隅に座ってスマートフォンを手に持つ姿。
精緻な筆致で描かれた作品。夕暮れ時、側面から差し込むバックライトが彼女を柔らかく照らしている。
1.5 で作成

2.0 で作成

このように、実写でも3Dでも2Dアニメでもない、独自のタッチを持った表現が可能となっており、従来のスタイルに縛られない柔軟なビジュアル表現が実現されています。
つまり、既存のスタイル同士の“間”をとったようなニュアンスの出力も可能で、創作の自由度が一段と広がったのが、この3つ目のポイントです。
Lin Daiyuがカフェにいる画像の比較です。こちらも左が1.5、右が2.0になります。
1.5の画像は、一般的なアニメスタイルのキャラクターで、MidjourneyやDALL·Eなど他の画像生成AIでもよく見られるクオリティです。誰でも比較的簡単に生成できそうな印象を受けます。
一方で、2.0の画像では、2D・3D・実写の中間のような、これまでにない独特のスタイルで描かれています。
このようなスタイルのバリエーションの幅広さや、独自表現の柔軟性が、アップデートの3つ目「様式化(多様なスタイルに準拠可能)」の大きな特徴です。
まとめ
今回の KOLORS2.0 の大幅アップデートでは、以下の3つの要素が大きく強化されました。
アップデート項目 | 内容 |
---|---|
① プロンプト順守の向上 | 複雑・詳細な指示にも忠実に対応。指示通りの構成や要素を再現可能に。 |
② 映画的なクオリティ | 照明・構図・色調に深みが増し、映像作品のような雰囲気を実現。 |
③ スタイルの多様化 | 60種以上のスタイルに準拠、独自のテイストを持つ表現も可能に。 |
以上が、 今回のアップデート内容の解説となります。
より高精度で多様なビジュアル表現が求められる現場において、大きな武器になるアップデートですね。