Image to Imageとは?建築パースの雰囲気調整に使う基本と設定
3DCGソフトでレンダリングした建築パースの質感をもう少しリアルに仕上げたい、あるいは同じ建物で「モダン」「北欧」「和風」と複数のスタイル案をクライアントに提示したい。こうした場面で力を発揮するのがImage to Image(Img2Img)です。
Img2Imgは元画像の構図やレイアウトを維持しつつ、質感・スタイル・雰囲気を変換するAI技術で、建築パース制作のポストプロセスやバリエーション提案に活用されています。
この記事では、Img2Imgの基本的な仕組みからControlNetとの使い分け、建築パースに特化した活用シーン、実務で役立つパラメータ設定まで整理します。
Image to Image(Img2Img)とは何か
Img2Imgは、元画像の構図を土台にしながら質感やスタイルを変換するAI画像生成の手法です。構造を厳密に保持するControlNetとは異なり、「全体の雰囲気を変える」ことに特化した技術として位置づけられています。
Img2Imgの基本的な仕組み
Img2Imgは、元画像に一定量のノイズ(あいまいさ)を加え、そこからプロンプトの指示に沿って画像を再構成する手法です。わかりやすく言えば、AIは元画像を「一度ぼかしてから描き直す」ような処理を行います。ノイズの量が少なければ元画像に近い仕上がり、多ければ大きく変化する仕組みです。
Text to Image(Txt2Img)がテキストプロンプトだけで画像をゼロから生成するのに対し、Img2Imgは元画像があるため配置のコントロールが容易な点が大きな違いです。3DCGで構図を確定させた上でImg2Imgに入力すれば、レイアウトはほぼそのままに質感だけをAIで仕上げられます。
このノイズの量を制御するのがDenoising Strength(ノイズ除去強度)というパラメータです。値が0に近いほど元画像に忠実な結果になり、1に近いほど元画像から大きく離れた画像が生成されます。建築パースの雰囲気調整では0.3〜0.6の範囲が実用的で、用途に応じて使い分けます。
ControlNetとの違いと使い分け
Img2ImgとControlNetはどちらも元画像を参照する技術ですが、役割が明確に異なります。Img2Imgは元画像「全体」の雰囲気やスタイルを変換するのに適し、ControlNetは元画像の「構造」(エッジ・深度・法線)を保持しながら全く新しい画像を生成するのに適しています。
建築パースでの使い分けの判断軸はシンプルです。構図を変えずに質感や雰囲気だけを調整したい場合はImg2Img、3DCGの下地から寸法精度を保った精密な建築パースを生成したい場合はControlNetが適しています。
両者を組み合わせることも可能です。海外の建築ビジュアルコミュニティでは、「ControlNet(Depth)で構造保持+Img2Img(Denoising 0.3〜0.5)で質感追加」というパイプラインが標準的に使われています。構造の精度とAIによる質感表現を両立できるため、実務での活用度が高い組み合わせです。
なお、Inpainting(部分修正)はImg2Imgの特殊な形態で、画像全体ではなくマスクで指定した領域だけを変換する技術です。全体の雰囲気調整(Img2Img)の後に部分修正(Inpainting)で仕上げるのが実務的な流れとなります。
建築パースでのImg2Img活用シーン
Img2Imgの実務上の強みは、1つの下地画像からDenoising Strengthを変えるだけで質感調整・スタイル変換・スケッチのイメージ化まで対応できる汎用性にあります。
3DCGレンダリング結果の質感強化
3DCGソフト(Blender / V-Ray等)でレンダリングした画像をImg2Imgに入力し、フォトリアルな質感を追加する使い方です。Denoising Strength 0.3〜0.5の範囲で元のレイアウトを維持しながら、素材感や光の表現を強化できます。
Photoshopでのポストプロセスと比較した場合、Img2Imgは複数のバリエーションを短時間で生成できるのが利点です。植栽や空の表現、人物の追加、光の演出といった要素は手動での調整に時間がかかりますが、Img2Imgなら複数の仕上がり案を数分で用意できます。
応用として、IP-Adapter(Image Prompt Adapter)と組み合わせるスタイル転送ワークフローも注目されています。過去のプロジェクトで好評だったパースのテイストを新しい案件に反映させるといった使い方が、海外の建築ビジュアル制作で実践されています。
スタイル変換——モダンから和風、昼景から夕景
同じ建物の外観パースを「モダン」「北欧」「和風」など異なるスタイルで出力し、クライアントにバリエーションを提示する使い方です。Denoising Strength 0.5〜0.7の範囲で、元の配置を保ちつつスタイルを大きく変えられます。
時間帯の変換も効率的に行えます。昼景のパースをベースに、プロンプトで”golden hour lighting”(夕景)や”night scene with warm interior lighting”(夜景)と指定するだけで、異なる時間帯のバリエーションを生成できます。
バリエーション提案に特化すれば、1つの下地画像から5〜10分程度で複数案を用意することも可能です。設計初期段階のクライアントミーティングで、方向性の合意形成を効率的に進める手段になるでしょう。
スケッチ・手描きラフからのイメージ化
手描きのスケッチやラフな図面をImg2Imgに入力し、フォトリアルな建築イメージに変換する使い方です。Denoising Strength 0.6〜0.8と高めの値を設定し、スケッチの構図だけを参考にしつつ大きく変換します。値が低すぎるとスケッチの線がそのまま残り、建築パースとしては不自然な仕上がりになります。
初期設計段階のクライアントプレゼンで「イメージの方向性」を素早く伝えるのに効果的です。精密な3DCGモデリングの前に、AIでラフなイメージを数パターン生成してクライアントの反応を確認する——というワークフローは、手戻りの削減にもつながります。
ただし、Img2Img単体ではスケッチの構造が崩れやすい点に注意してください。ControlNetのScribbleモデルと併用することで、スケッチの構図をより正確に維持できます。Img2Imgはスケッチの「雰囲気の方向づけ」、ControlNetは「構造の保持」と役割を分担させるのがコツです。
Img2Imgの主要パラメータと設定のコツ
Img2Imgの出力品質を左右するパラメータは3つあります。それぞれの推奨値と調整の考え方を、建築パースの用途に絞って整理します。
Denoising Strength・Steps・CFG Scaleの調整
Denoising Strength(ノイズ除去強度)は最も重要なパラメータで、元画像からの変化量を決定します。用途別の目安は次の通りです。
- 0.3〜0.5: 質感調整(3DCGレンダリングのフォトリアル化)
- 0.5〜0.7: スタイル変換(モダン→和風、昼→夕景など)
- 0.7〜0.9: 大幅な変換・スケッチ入力
Sampling Steps(生成ステップ数)は20〜30で開始するのが一般的です。品質が不足する場合は40まで上げてみてください。それ以上はコストに対する品質向上が小さくなります。
CFG Scale(プロンプトへの忠実度)は7〜12が建築パースでの目安です。高すぎるとプロンプトに過度に従い、色味や質感が不自然になることがあります。
ただし、これらの推奨値はSDXL以前のモデルを前提としたものです。FLUX.1ではCFG Scaleの概念がGuidance Scaleに置き換わっており、SD3ではSteps数の推奨値も異なります。使用するモデルのドキュメントを確認した上で調整してください。
最適値を効率的に探る手法として「Denoising Sweep」があります。同一の下地画像に対してDenoising Strengthを0.1刻みで変化させた複数のバリエーションを一括生成し、視覚的に比較する方法です。ComfyUIのバッチ処理機能を使えば、この比較を自動化できます。
まとめ
Image to Image(Img2Img)は、元画像のレイアウトを維持しつつ質感やスタイルを変換するAI技術です。本記事のポイントを整理します。
- Img2Imgは元画像にノイズを加えて再構成する手法で、Denoising Strengthの値によって変化の度合いをコントロールできます
- 建築パースでは3DCGレンダリングの質感強化(0.3〜0.5)、スタイル変換(0.5〜0.7)、スケッチのイメージ化(0.7〜0.9)の3パターンで活用します
- 構造の精密な保持にはControlNet、全体の雰囲気調整にはImg2Imgという使い分けが基本で、両者の併用で品質を高められます
- CFG ScaleやSteps数はモデルによって推奨値が異なるため、使用モデルのドキュメントに沿って調整してください
関連技術もあわせて理解を深めることをおすすめします。
- 構造保持の技術は「ControlNetとは?」
- 部分修正の技術は「Inpaintingとは?」
- ComfyUIでの具体的な操作方法は「ComfyUIとは?」

