ComfyUI 複数ControlNet併用テクニック｜実務の組み合わせ5選

2026年4月23日

ComfyUI（ノードをつないで画像生成AIを動かすツール）でControlNet（コントロールネット）を使うと、構図やポーズを細かく制御できます。しかし1つのControlNetだけでは、空間の奥行きと細部のディテールを同時にコントロールするのが難しいと感じる方も多いのではないでしょうか。

そこで有効なのが、複数のControlNetを併用するテクニックです。たとえばDepth（深度マップ）で空間構造を固定しながら、Canny（エッジ検出）で輪郭のディテールを保持する使い分けができます。建築現場で基礎屋・大工・内装屋が役割分担するように、ControlNetも担当範囲を分けると全体の精度が上がります。

この記事では、ComfyUIで複数ControlNetをチェーン接続する具体的な手順から、代表的な組み合わせパターン、strengthバランスの調整法、VRAM（GPUの作業メモリ）対策までを解説します。SDXL（Stable Diffusionの高解像度版）時代のデファクトである ControlNet Union SDXL や段階的強度適用（Phased Strength）といった海外標準の手法もあわせてまとめます。

体験カリキュラム

Blenderで作る
初めての建築3DCGパース

Blenderの導入から基本操作、太陽光の入る白い部屋の制作まで。全3本のカリキュラムを体験できます。

Blenderの導入から基本操作、
太陽光の入る白い部屋の制作まで。
全3本のカリキュラムを体験できます。

まずは体験カリキュラムを受講

複数ControlNetを併用するメリット

ControlNetは、生成画像の特定の要素を制御するための仕組みです。Depthなら奥行き、Cannyなら輪郭線、OpenPose（人物ポーズ検出）なら人物のポーズといった具合に、それぞれ得意な制御対象が異なります。

1つのControlNetで制御できるのは、基本的に1つの要素だけです。建築パースの生成を例にすると、Depthだけでは空間の奥行きは再現できても、窓枠や手すりなどの細かいディテールが崩れやすくなります。逆にCannyだけでは輪郭は保持できても、空間全体の構造が不安定になりがちです。

複数ControlNetを併用すると、こうした弱点を補い合えます。空間構造の安定性とディテールの正確性を両立でき、求められる品質に近づけやすくなります。では、具体的にどのように接続すればよいのでしょうか。

ComfyUIで複数ControlNetを接続する方法

ComfyUIで複数のControlNetを使うアプローチは、2026年4月現在で主に3つあります。チェーン接続、スタック方式、そしてSDXL時代のデファクトとなりつつある単一モデル方式です。CADで複数の外部参照を束ねる方法が時代とともに変わってきたのと似た流れで、運用の手間が減る方向へ進化しています。

Apply ControlNetノードのチェーン接続

もっとも基本的な方法が、Apply ControlNetノードを直列につなぐチェーン接続です。手順は次のとおりです。

1つ目のApply ControlNetノードを配置し、ControlNetモデル（例：Depth）と前処理済み画像を接続します
1つ目のconditioning出力を、2つ目のApply ControlNetノードのconditioning入力へつなぎます
2つ目のノードには別のControlNetモデル（例：Canny）と、対応する前処理済み画像を接続します
最終的なconditioning出力をKSampler（画像生成の中核ノード）へ渡します

ポイントは、positive / negativeの両方のconditioningを同じ順序でチェーン接続することです。片方だけつなぐと意図しない結果になる場合があります。

CR Multi-ControlNet Stackを使う方法

カスタムノード「ComfyUI Comfyroll」に含まれる CR Multi-ControlNet Stack を使うと、複数のControlNetをスタック形式で一括管理できます。各ControlNetのオン・オフ切り替えやstrength調整がひとつのノード上でまとまるため、試行錯誤の効率が上がります（2026年4月現在の最新版で動作確認）。

チェーン接続と比較すると、ワークフローの見通しがよくなる点が利点です。ただしカスタムノードへの依存が増えるため、標準ノードだけで完結させたい場合はチェーン接続を選ぶと依存関係が最小で済み、環境の再現性も保ちやすくなります。

ControlNet Union SDXLで1モデル運用する方法

2026年4月現在、SDXL環境ではxinsirがリリースした ControlNet Union SDXL が実質デファクトとなっています。Canny・OpenPose・Depth・LineArt・MLSD・Scribble・Hed・SoftEdge・Teed・Segment・Normal など10種以上の制御を1モデルで扱える統合型です。

使い方は、同じUnionモデルを2つのApply ControlNetノードに接続し、それぞれの control type filter で「Depth」「Canny」と別種類を指定します。追加モデルをロードしないためVRAM消費量が抑えられ、複数種類を同時適用しても計算コストが増えにくいのが特長です。SD1.5時代の「種類ごとに別モデルをロード」という発想から、「1モデル多用途」へ移行が進んでいます。

代表的な組み合わせパターン5選

複数ControlNetの組み合わせは目的によって最適解が変わります。工具箱で「粗加工の工具」と「仕上げの工具」を組み合わせるのに近く、どのパターンが自分のワークフローに合うか、代表的な5つを見ていきましょう（SDXL＋ControlNet Union 基準、2026年4月現在）。

Depth＋Canny：空間構造×輪郭ディテール

もっとも汎用性が高い組み合わせです。Depthが空間全体の奥行きと構造を固定し、Cannyが窓枠・家具・建具などの輪郭線を保持します。建築パースやインテリア画像の生成に適しています。

建築パース生成の実務では、Depth＋Cannyの二段構えが基本構成として広く採用されています。Depthのstrengthをやや高め（0.6程度）、Cannyを控えめ（0.4程度）に設定すると、空間構造を優先しながらディテールを補完するバランスが取りやすくなります。

Depth＋OpenPose：空間×人物ポーズ

室内パースに人物を配置したい場合に効果的な組み合わせです。Depthで部屋の空間構造を維持しつつ、OpenPoseで人物のポーズと位置を指定できます。

建築ビジュアライゼーションで「生活感のある空間表現」を求められるケースで活躍します。人物のスケール感が空間の広さを伝える手がかりにもなるため、プレゼンテーション用のパース制作で役立ちます。

Canny＋Scribble：輪郭×ラフスケッチ

手描きのラフスケッチをベースに、既存画像の輪郭線で細部を補完するパターンです。デザインの初期段階で、ラフなアイデアを素早くビジュアル化したい場面に向いています。

Scribbleのstrengthを低め（0.3〜0.4）に設定すると、ラフの雰囲気を残しつつCannyで細部が補正されます。

Depth＋Lineart：建築パース向け

Lineartは線画の情報をもとに制御するControlNetです。Depthと組み合わせると、建築図面のような正確な線情報と空間の奥行きを同時に反映できます。

図面からパースを起こすワークフローで特に有効です。なおDepthの前処理器は、建築・室内シーンでは Zoe-DepthMapPreprocessor が最良とされます。MiDaS系に比べて複雑な空間構造の保持性能が高く、ComfyUI公式ドキュメントでも建築用途で推奨される前処理器です（2026年4月現在）。

Canny＋Tile：高解像度アップスケール向け

Tileは画像を分割して処理するControlNetで、高解像度化に強みがあります。Cannyで輪郭を保持しながらTileでアップスケールすると、ディテールの崩れを抑えた高解像度画像を生成できます。印刷用途やクライアント提出用に解像度を上げたい場面で役立ちます。

strengthバランスの調整ガイド

複数ControlNetを併用する際、もっとも重要なパラメータが strength（強度）です。塗料の調色と似ていて、配合比を外すと仕上がり全体が崩れるため、適切に調整しないと画像が破綻する原因になります。

strengthの基本的な考え方

strengthは 0.0 から 1.0 の範囲で設定し、そのControlNetが生成結果に与える影響の大きさを決めます。1.0 で最大の制御力、0.0 で影響なしです。

複数ControlNetを併用する場合、各strengthの合計を 1.0 前後に収めるのが目安です。合計が高すぎると各ControlNetの指示が競合し、画像が破綻しやすくなります。逆に低すぎると制御が弱くなり、意図した構図から外れやすくなります。

片方のstrengthだけが他方より顕著に高いと、支配的になって他方の制御が抑え込まれがちです。片方を強くしすぎず、両方を行き来して調整するのが基本です。

段階的強度適用（Phased Strength）

海外の実践ガイドで標準概念化しているのが、段階的強度適用（Phased Strength）という考え方です。生成プロセスを 0〜30% / 30〜70% / 70〜100% の3フェーズに分け、各フェーズで異なるControlNetに主導権を渡す手法です。

具体例を示します。Depth を start_percent: 0.0 / end_percent: 0.3 で高めのstrength、Canny を start_percent: 0.3 / end_percent: 0.7 で中程度のstrength、Tile を start_percent: 0.7 / end_percent: 1.0 で低めのstrengthに設定する構成です。前半で空間構造を固め、中盤でディテールを詰め、後半で仕上げの質感を載せる流れになります。

ComfyUIのApply ControlNetノードにある start_percent / end_percent が、この段階的適用を実現するためのパラメータです。

実務でのチューニング手順

strengthの調整で迷ったときは、以下の手順で段階的に進めると原因の切り分けがしやすくなります。

まず1つ目のControlNetだけで生成し、基本的な構図を確認します
2つ目のControlNetを追加し、strength: 0.3 程度の低い値から始めます
結果を見ながら 0.1 刻みでstrengthを調整します
必要に応じて start_percent / end_percent で適用範囲を分けます

一度に複数のパラメータを変更すると原因の特定が難しくなるため、1つずつ変更して結果を確認するのが効率的です。

領域マスクで空間的に役割を分ける上級テク

もう一段踏み込んだ手法として、領域マスクでControlNetを空間的に分割する方法もあります。ComfyUI-Advanced-ControlNet（Kosinkadink）拡張を導入すると、attention mask に対応したApply ControlNetノードが使え、「画像の左半分はDepth、右半分はCanny」といった領域別制御が実現します。

空間の手前側と奥側で異なる制御を効かせたいとき、あるいは建築パースで人物配置エリアだけにOpenPoseを効かせたいときに役立つ上級テクです。

VRAM消費の増加と対策

複数ControlNetを読み込むと、その分だけVRAM消費量が増加します。お使いのGPUのVRAMは足りているでしょうか。ここでは実用的な対策を紹介します。

VRAM消費の目安

2026年4月現在、SD1.5ベースのControlNetモデルは1つあたり約1.4GBのVRAMを消費します。SDXLベースでは約2.5GBです。2つ併用すると、ベースモデルと合わせて 8GB 以上のVRAMが必要になるケースが一般的です。

ここで効いてくるのが前述の ControlNet Union SDXL です。複数種類を同時に使っても、ロードされるのは 1 モデル分のVRAMで済みます。8〜12GB環境で複数制御を実用する現実的な選択肢となります（2026年4月現在）。

具体的な対策

前処理の事前実行がもっとも効果的な対策です。ControlNetの前処理（Canny検出やDepth推定）と本生成を同時に実行すると、前処理モデルと生成モデルが同時にVRAMを占有します。前処理済みの画像をあらかじめ保存しておき、本生成時には前処理モデルを読み込まない構成にすると、ピークVRAMを大幅に削減できます。

そのほか、Tiled VAE Decode（潜在空間から画像へ戻す処理）の活用（タイルサイズ 512 推奨）や、ComfyUI の Dynamic VRAM システムを有効にすることで、8〜12GB環境でも複数ControlNetの運用が現実的になります。

IPAdapterとControlNetの併用

IPAdapter（Image Prompt Adapter）はControlNetとは異なるアプローチで画像生成を制御します。両者を組み合わせると、さらに高度な制御が可能です。建築で言えば「躯体はControlNetが担当し、内装テイストはIPAdapterが担当する」という役割分担のイメージです。

役割の違い

IPAdapterは参照画像のスタイル（色調・質感・雰囲気）を転写する仕組みです。一方、ControlNetは構図やポーズといった構造的な要素を制御します。この役割分担を理解しておくと、併用時の設計がスムーズになります。

接続方法

ComfyUIでは、IPAdapterとControlNetはそれぞれ独立してconditioningに適用します。IPAdapterは ComfyUI_IPAdapter_plus のIPAdapter Applyノードで、ControlNetはApply ControlNetノードで接続し、最終的にKSamplerへ渡す流れです（ComfyUI_IPAdapter_plus 2026年4月現在の最新版で動作確認）。

建築パースでの活用例

建築ビジュアライゼーションの実務では、参考にしたい既存の建築写真をIPAdapterで読み込み、マテリアルの質感や光の雰囲気を転写する事例が多く見られます。同時にDepthで空間構造を固定することで、「参考写真の雰囲気を持った新しい空間」を生成できます。

クライアントから提供されたイメージ写真と間取り図を組み合わせる場面では、この手法が選ばれるケースが多く見られます。

まとめ

ComfyUIで複数のControlNetを併用すると、1つだけでは実現できない精度の高い画像制御が可能になります。接続方式はチェーン接続・スタック方式・ControlNet Union による1モデル方式の3択で、SDXL環境ならUnionを第一候補に検討するとVRAMと運用性の両面で有利です。

strengthは合計 1.0 前後に収めつつ、段階的強度適用（Phased Strength）で役割分担させると安定します。VRAM消費の増加には前処理の事前実行や Tiled VAE、そして ControlNet Union での単一モデル化で対処できます。IPAdapterとの併用も視野に入れると、スタイル転写と構図制御を両立した高品質な画像生成に近づけます。

この記事を書いた人

橘美咲 PERSC 専任講師

「CADは裏切らない。昨日引けなかった線が、今日は引ける。それが楽しいの」

元・完全未経験の文系女子。新卒で入った建築現場で「図面が読めない」と絶望し、悔し涙を流しながらCADを独学で習得した過去を持つ。その後、設計事務所、ゼネコンを経てフリーランスへ転身。現在はPERSCにて「現場で本当に使える技術」を伝授する鬼（？）コーチとして活動中。「線一本にも意味がある」が口癖。趣味は、完成した建物を見上げながらのビールと、深夜の猫動画巡回。

この著者の記事一覧へ

ComfyUI 複数ControlNet併用テクニック｜実務の組み合わせ5選

Blenderで作る
初めての建築3DCGパース

複数ControlNetを併用するメリット