ControlNetとは?建築AIで形を崩しにくくする基本
AI画像生成で建築パースを作ると、窓の数が変わったり壁面の凹凸が消えたりと、構造が崩れる問題に直面した経験はないでしょうか。
実はこの制御はテキストプロンプトだけでは、建物のディテールを正確にコントロールするのは困難です。
ControlNetは、こうした構造破綻を防ぐために開発された条件制御技術で、エッジや深度情報をAI生成の制約として与えることで、3DCGの下地構造を保ったままAI仕上げを実現します。
この記事では、ControlNetの基本的な仕組みから建築パースで特に重要なモデル(Depth・Canny・Normal Map)の使い分け、ComfyUIでの導入方法まで、パース制作者が押さえておくべきポイントを整理します。
ControlNetとは何か——AI画像生成の「構造制御」技術
ControlNetは、参照画像から抽出した構造情報をAI画像生成の制約条件として与える技術です。3DCGで作った正確な形状をAIに引き継げるため、建築パースにおいて形状崩れを防ぐ最も直接的な手段となっています。
ControlNetの基本的な仕組み
ControlNetは、2023年に発表された条件制御生成技術として広く普及しています。通常のAI画像生成ではテキストプロンプトだけで出力内容を指示します。ControlNetを使うと、参照画像のエッジ(輪郭線)・深度(奥行き)・法線(面の向き)といった構造情報を生成の制約として追加できます。
たとえば、Blenderで作成した建物の3DCGからDepthマップ(深度画像)を出力し、ControlNetに入力すると、AIは建物の立体構造を維持したまま質感や雰囲気だけを変更した画像を生成します。テキストプロンプトだけでは「窓を3つ横に並べて」といった細かい配置指定が難しいですが、ControlNetなら3DCGの正確な配置をそのまま反映できるのが強みです。
対応する画像生成モデルは、Stable Diffusion(SD1.5 / SDXL)で広く利用されています。FLUX.1向けのControlNetモデルも開発が進んでいますが、2026年時点ではSD系ほどのモデルバリエーションには達していません。ComfyUI上でノードとしてワークフローに組み込めるため、パース制作者にとって導入しやすい環境が整っています。
建築パースでControlNetが不可欠な理由
AI画像生成は美しいイメージを手軽に作れる半面、建築パースの実務では致命的な問題を抱えています。窓の数が増減する、スケール感が崩れる、壁面の凹凸が消えるといった構造破綻が頻発するためです。建築パースはクライアントへの提案資料であり、寸法精度や意匠の正確性が求められます。
ControlNetを使えば、3DCGソフトで作った正確な形状データをAI生成に反映できるため、寸法精度を保ったまま質感・雰囲気だけをAIに任せるという分業が可能になります。実務レベルのパース制作では、ControlNetに代表される構造制御技術が不可欠といえるでしょう。
なお、構造制御のアプローチはControlNetだけではありません。IPAdapter(参照画像のスタイルを転送する技術)やT2I-Adapterなども存在しますが、3DCG下地からの構造維持という用途ではControlNetが最も直接的で信頼性の高い選択肢です。
建築パースで使う主要なControlNetモデル
建築パースの用途では、Depth(奥行き維持)とCanny(輪郭固定)の2つが基本です。用途に応じてNormal MapやMLSDを加えることで、素材の凹凸や直線要素をさらに精密に制御できます。
Depthモデル——空間の奥行きを保持する
Depthモデルは、画像の奥行き情報(深度マップ)を使って空間構造を維持するControlNetモデルです。深度マップでは近い物体を白、遠い物体を黒で表現します。この明暗の情報をもとに、AIが空間の前後関係を保った画像を生成する仕組みです。
建築パースで最も精度が高い方法は、3DCGソフト(Blender / 3ds Maxなど)からDepthパスを直接出力し、ControlNetに入力するやり方です。外観パースでは建物の立体感や周辺との前後関係、内観パースでは部屋の奥行きや家具配置の維持に効果を発揮します。
3DCGの下地がない場合でも、既存の写真からDepth Anything V2やMiDaSといった単眼深度推定モデルを使って深度マップを生成できます。特にDepth Anything V2は屋外建築シーンの奥行き推定精度が高く、ControlNetのDepthプリプロセッサとして推奨されています。
Cannyモデル——輪郭線で形状を固定する
Cannyモデルは、画像のエッジ(輪郭線)を検出し、その線に沿って画像を生成するControlNetモデルです。建物の窓枠・壁面の境界・手すりなど、直線的な要素が多い建築パースとの相性が優れています。
外観パースでは窓位置やファサードの構成を正確に固定でき、意匠の細部が崩れにくくなります。Cannyエッジ検出には閾値の設定があり、この値によって拾うエッジの細かさが変わります。建築パースでは窓枠や柱といった構造線を確実に拾いつつ、テクスチャの微細なエッジは省くバランスが重要です。閾値が低すぎるとノイズが増え、高すぎると必要な輪郭を取りこぼすため、用途に応じた調整が求められます。
DepthとCannyを同時に使う「Multi-ControlNet」も有効な手法です。奥行きと輪郭の両方を維持できるため、立体感と意匠の正確性を両立した高精度なAI仕上げが可能になります。
Normal Mapモデル——面の方向で素材感を保つ
Normal Mapは面の向き(法線方向)を色情報で表現したもので、壁面・天井・床面の方向性を再現できるControlNetモデルです。DepthやCannyが空間構造や輪郭の維持を担うのに対し、Normal Mapは素材の凹凸表現に強みがあります。
壁面タイルの凹凸、コンクリート打ち放しの表面テクスチャ、木目の方向性といった微細な面の情報を制御できるため、外装ファサードの素材感にこだわる仕上げで効果を発揮します。DepthやCannyで構造の大枠を固定した上で、Normal Mapで素材の凹凸を精密にコントロールする組み合わせは、仕上げ品質に差が出る場面で有効でしょう。
その他のモデル——MLSD・Tile・ControlNet Union
建築パース制作で知っておきたいモデルがもう3つあります。
MLSDは直線検出に特化したモデルで、窓枠や壁面境界、手すりなどの直線要素を精密に固定します。Cannyとの併用で建築パース特有の直線性をさらに強化できます。
Tileモデルは画像の局所的な細部を維持しながらアップスケール(高解像度化)するモデルです。Depth・Cannyで構造を固定した画像を生成し、その後Tileモデルで高解像度化する3段階のワークフローは、大判印刷にも耐える品質を実現します。
ControlNet Unionは、Depth・Canny・Normal・Scribbleなど複数モデルを1つに統合した軽量モデルです。複数のControlNetを同時に使用するとVRAMの消費が大きくなります。Unionモデルなら1つのモデルで複数の制御タイプを切り替えられるため、メモリの節約と管理の簡素化を両立できます。
ControlNetを使うための環境と始め方
ControlNetの利用環境はComfyUIが主流です。「プリプロセッサで前処理→ControlNet Applyで適用→画像生成」という3段階のフローを理解すれば、すぐにワークフローを構築できます。
ComfyUIでの使い方(概要)
ComfyUIではControlNetをノードとしてワークフローに組み込みます。基本的な流れは次の通りです。
まず、入力画像をプリプロセッサノード(Canny Edge DetectorやDepth Anythingなどのカスタムノード)で前処理し、エッジマップや深度マップを生成します。3DCGソフトからDepthパスを直接出力している場合は、このプリプロセッサの工程を省略できます。
次に、生成されたマップと画像生成モデルを「ControlNet Apply」ノードに接続します。ComfyUI Manager(拡張機能マネージャー)を使えば、ControlNetモデルのダウンロードや管理も手軽に行えます。ワークフローをJSON形式で保存しておけば、毎回同じ設定で再現性の高い生成が可能です。
建築パース用の実務的なワークフロー概要
建築パースにおけるControlNetの実務的なフローは、次の4ステップで構成されます。
- 3DCGソフト(Blender / 3ds Maxなど)で下地をレンダリングする
- Depth / Cannyマップを出力する(3DCGからの直接出力または写真からのプリプロセッサ処理)
- ComfyUIのControlNetノードにマップを入力し、プロンプトで質感・雰囲気を指定する
- AI生成を実行し、結果を確認・調整する
調整で重要なパラメータは2つです。1つ目はControlNet Strength(制御強度)で、0.5〜0.8が建築パースでは一般的な目安となります。1.0に近づけると構造維持は強まりますが、AIの表現力が制限され、硬い仕上がりになりがちです。
2つ目はStart/End Percent(生成過程のどの段階でControlNetを効かせるか)です。Start=0 / End=0.5〜0.8に設定すると、生成の前半で構造を固定しつつ後半はAIの表現力に委ねるバランスが取れます。Strengthだけでなくこのパラメータも品質に大きく影響するため、併せて調整してみてください。
操作の詳細については、「ComfyUIのノードとは?」や、「ComfyUIとは?」も参考になります。
まとめ
ControlNetは、AI画像生成における構造制御技術として建築パースの形状崩れ防止に欠かせない存在です。本記事のポイントを整理します。
- ControlNetは参照画像のエッジ・深度・法線などの構造情報をAI生成の制約として与え、建物の形を維持したまま質感や雰囲気を変更できる技術です
- 建築パースではDepth(奥行き維持)とCanny(輪郭固定)が基本モデルとなり、3DCGソフトからの直接出力が最も精度の高い入力方法です
- Normal Map・MLSD・Tileなどのモデルを組み合わせることで、素材の凹凸再現や高解像度化にも対応できます
- ControlNet StrengthとStart/End Percentの2つのパラメータで、構造維持と表現自由度のバランスを調整します
- 複数モデルの同時使用にはControlNet Unionモデルがメモリ効率の面で有効です
ControlNetと組み合わせて使われる関連技術についても、あわせて確認しておくことをおすすめします。
- ComfyUIの基本は「ComfyUIとは?」
- 全体の雰囲気調整は「Image to Imageとは?」
- 部分修正は「Inpaintingとは?」
- 3DCGからAI仕上げまでの全体ワークフローは「3DCG→AI補助ワークフロー」

