ComfyUI完全解説ガイドできること・始め方・学習ロードマップ

2026年4月23日

橘美咲

「ComfyUI（コンフィーUI）」は、画像生成AIをノードと呼ばれるブロックの組み合わせで操作する無料のオープンソースツールです。テキストから画像を作るだけでなく、動画生成や建築パースの作成まで幅広い用途に対応しています。

しかし、初めて触れる方にとっては「何ができるのか」「どこから始めればいいのか」がわかりにくいのではないでしょうか。

この記事では、ComfyUIの概要から具体的な活用方法、必要な環境、学習の進め方までを一気に解説します。全体像を把握したうえで、自分に合った学習ステップを見つけてください。

体験カリキュラム

Blenderで作る
初めての建築3DCGパース

Blenderの導入から基本操作、太陽光の入る白い部屋の制作まで。全3本のカリキュラムを体験できます。

Blenderの導入から基本操作、
太陽光の入る白い部屋の制作まで。
全3本のカリキュラムを体験できます。

まずは体験カリキュラムを受講

ComfyUIとは何か

ComfyUIの正体を一度に掴むには、ツールとしての仕組み・競合との違い・選ばれている理由の3点から見ていくのが近道です。ここではノードベースという独自の操作方式から順に、ComfyUIが何者なのかを整理します。

ノードベースの画像生成AIツール

ComfyUIとは、Stable Diffusion（画像生成AIの代表格）やFlux（高品質な新世代画像生成モデル）などの画像生成AIモデルを動かすためのインターフェースです。最大の特徴は「ノードベース」という操作方式にあります。

ノードとは、特定の処理を行う小さなブロックのことです。モデルの読み込み、テキストの解析、画像の生成といった処理がそれぞれ独立したノードになっており、これらを線でつないでワークフローを組み立てます。映像編集ソフトのノードエディタやプログラミングのフローチャートに近い感覚です。

公式サイト（comfy.org）では「最も強力なノードベースのAIアプリケーション」と紹介されており、画像だけでなく動画、3D、オーディオまで生成できるプラットフォームへと進化しています。

Stable Diffusion WebUIとの違い

画像生成AIのインターフェースとしては、AUTOMATIC1111が開発した「Stable Diffusion WebUI」も広く使われています。では、ComfyUIと何が違うのでしょうか。

最も大きな違いは操作方式です。WebUIはテキスト入力欄やスライダーで設定するパラメータ操作型で、直感的に使えます。一方、ComfyUIはノードを自由につなぎ替えることで、生成プロセスを細かくカスタマイズできます。

処理速度にも差があります。同じ条件でバッチ生成を行った場合、ComfyUIはWebUIの約2倍のスピードで処理を完了したという検証結果も報告されています。メモリ効率にも優れており、同じハードウェアでより大きなモデルや高解像度の画像を扱えるのが強みです。

手軽に始めたいならWebUI、細かな制御や効率を重視するならComfyUIという使い分けが扱いやすい進め方です。

ComfyUIが選ばれる3つの理由

ComfyUIは2026年4月現在、GitHubで約89,000スターを獲得し、累計ダウンロード数は180万回を超えています。なぜこれほど多くのユーザーに選ばれているのでしょうか。

理由1: ワークフローの完全な再現性
ComfyUIのワークフローはJSON形式で保存され、生成画像のメタデータにも自動で埋め込まれます。同じノード構成と同じシードを使えば、誰がどの環境で実行しても同一の結果が得られます。チームでの共有や作品の再現に適した仕組みです。

理由2: 巨大なコミュニティとエコシステム
2026年4月現在、1,000を超えるカスタムノードパッケージがコミュニティから公開されています。AnimateDiff、IPAdapter、CogVideoXなど、標準機能にない処理もカスタムノードで自由に追加できます。Stable Diffusion利用者の約65%がComfyUIを選んでいるという調査データもあり、エコシステムの成長は加速しています。

理由3: 高いメモリ効率と処理速度
ComfyUIはリソース効率に優れた設計で、限られたGPUメモリでも大きなモデルを動かせます。同じハードウェアでWebUIより大きな画像を生成できるため、コストパフォーマンスの面でも有利です。

ComfyUIでできること

ComfyUIは画像生成だけのツールではありません。ここでは主な活用分野を紹介します。

テキストから画像を生成する（txt2img）

最も基本的な機能が、テキストプロンプトから画像を生成するtxt2img（テキスト・トゥ・イメージ）です。「夕日が差し込むモダンなリビングルーム」のようにテキストで指示するだけで、AIがイメージを生成します。

Stable Diffusion 1.5、SDXL（Stable Diffusionの高解像度版）、Fluxなど複数のモデルに対応しており、サンプリング方法やCFG（Classifier-Free Guidance、プロンプト追従度）スケール、ステップ数を細かく調整できます。生成結果に納得がいかなければ、ノードのパラメータを変えて即座に再生成できます。試行錯誤のしやすさもComfyUIの強みです。

画像を別の画像に変換する（img2img・インペイント）

既存の画像をベースに新しい画像を生成するimg2img（イメージ・トゥ・イメージ）も得意分野です。手描きのスケッチをリアルな画像に変換したり、写真の一部だけを塗り替えるインペイントも可能です。

建築やインテリアの分野では、ラフなスケッチからフォトリアルなイメージを生成する使い方が広がっています。

動画を生成する

ComfyUIは静止画だけでなく、動画生成にも対応しています。AnimateDiff、Stable Video Diffusion、WanVideoといったモデルを組み込むことで、テキストや画像から短い動画クリップを生成できます。

ControlNet（コントロールネット）と組み合わせれば、既存の動画からポーズ情報を抽出し、そのポーズに沿った新しい動画を生成することも可能です。動画生成の詳しい手順はComfyUI 動画生成ガイド【2026年版】モデル選びと実践ワークフローで解説しています。

建築パースを生成する

ComfyUIは建築・インテリア分野でも注目されています。間取り図やラフスケッチをControlNetで読み取り、フォトリアルな建築パースを生成するワークフローが実用段階に入っています。

従来の3DCGレンダリングでは数時間かかっていた作業が、ComfyUIなら数分で完了するケースもあります。建築パース生成の具体的な手法はComfyUI×建築パース生成完全ガイドで詳しく紹介しています。

ComfyUIの始め方

ComfyUIをゼロから動かすには、インストール方法の選択と起動後の最初の画像生成という2段階があります。ここでは3つある導入パターンを概観したあと、初回起動から最初の一枚を生成するまでの具体的な流れを順に追います。

インストールの全体像

ComfyUIを始めるには、大きく3つの方法があります。

ComfyUI Desktop（デスクトップ版）: Windows/Mac対応のスタンドアロンアプリです。ダウンロードしてインストールするだけで使えるため、初心者に扱いやすい選択肢です。

ポータブル版（Windows向け）: ZIPファイルを展開するだけで動作する軽量版です。複数バージョンの並行運用や、USBメモリでの持ち運びにも対応します。

手動インストール（Git Clone）: GitとPythonの環境を自分で構築する方法です。最新の開発版を使いたい方や、Linux環境で運用したい方に適しています。

どの方法を選んでも、基本的な操作方法は共通です。導入手順の詳細はComfyUI 導入・環境構築ガイドにまとめています。

初回起動からはじめての画像生成まで

ComfyUIを起動すると、ブラウザ上にノードエディタが表示されます。初期状態でも基本的なワークフローが読み込まれているため、モデルファイルを配置すれば「Queue Prompt」ボタンを押すだけで画像を生成できます。

最初のステップとしては、以下の流れが扱いやすい進め方です。

チェックポイントモデル（.safetensors）をmodelsフォルダに配置する
ブラウザでhttp://localhost:8188を開く
プロンプト欄にテキストを入力して「Queue Prompt」を押す

はじめは難しく感じるかもしれませんが、基本のワークフローはわずか5〜6個のノードで構成されています。一度動かしてしまえば、あとはノードを追加・変更しながら試行錯誤するだけです。

必要なPC環境

ComfyUIを実務で使えるスピードで動かすには、GPUの性能が快適性を大きく左右します。ここではローカルPCで動かす場合の推奨スペックと、高性能GPUを持たない場合の選択肢となるクラウドGPUの2方向から必要環境を整理します。

GPU・メモリ・ストレージの目安

ComfyUIを快適に動かすには、NVIDIA製のGPUが事実上必須です。VRAM（GPUの作業メモリ）は最低4GBから動作しますが、実用的には8GB以上を推奨します。

システムメモリ（RAM）は16GB以上、ストレージはモデルファイルの保存に数十GBが必要です。SDXLやFluxなど大型モデルを複数使う場合は、SSDに100GB以上の空き容量があると安心です。

PCスペックの詳しい要件と予算別のおすすめ構成はComfyUI PC環境・ローカル生成ガイドで解説しています。

クラウドGPUという選択肢

高性能なGPUを持っていなくても、ComfyUIを使う方法はあります。RunPodやVast.aiなどのクラウドGPUサービスを利用すれば、A100やH100といったハイエンドGPUを時間単位で借りられます。

また、ComfyUI公式が提供するComfy Cloud（Beta）も選択肢の一つです。ブラウザ上でワークフローを実行できるため、GPUを搭載していないPCからでもComfyUIの機能を試せます。

クラウド環境の詳しい活用方法は、導入ガイドの中でも触れています。

ノードとワークフローの基本

ComfyUIの操作の根幹にあるのが、ノードとワークフローという2つの概念です。ここではまずノードとは何かを押さえたうえで、代表的なtxt2imgワークフローがどんな部品で組み立てられているかを順に見ていきます。

ノードとは何か

ComfyUIのノードは、1つの処理を担当する部品です。たとえば「Load Checkpoint」ノードはモデルの読み込み、「CLIP（テキストを数値化する処理）Text Encode」ノードはテキストプロンプトの解析、「KSampler（画像生成の中核ノード）」ノードは画像の生成処理を担います。

各ノードには入力ポートと出力ポートがあり、出力を別のノードの入力につなぐことで処理の流れを作ります。この一連のつながりが「ワークフロー」です。

ワークフローはJSON形式で保存でき、画像のメタデータにも自動で埋め込まれます。他の人が生成した画像をComfyUIにドラッグ&ドロップするだけで、そのワークフローを再現できる仕組みです。

基本ワークフローの構成要素

最もシンプルなtxt2imgワークフローは、以下のノードで構成されています。

Load Checkpoint: モデルファイルの読み込み
CLIP Text Encode（ポジティブ）: 生成したい内容のテキスト入力
CLIP Text Encode（ネガティブ）: 避けたい要素のテキスト入力
Empty Latent Image: 生成する画像のサイズ指定
KSampler: AIによる画像生成処理
VAE Decode（画像と潜在表現を相互変換する処理）: 潜在空間から画像への変換
Save Image: 画像の保存

わずか7つのノードですが、この基本構造を理解すれば、あとは必要なノードを追加していくだけで高度なワークフローに発展させられます。ノードの詳しい使い方はComfyUI ノード基礎・基本ワークフローガイドを参照してください。

モデルの選び方

ComfyUIで生成される画像の品質やスタイルは、使うモデルによって大きく変わります。ここではモデルの種類と役割を押さえたうえで、目的別のモデル選定ガイドへと進みます。

チェックポイントモデルとは

ComfyUIで画像を生成するには「チェックポイントモデル」と呼ばれるAIモデルが必要です。拡張子は.safetensorsや.ckptで、ファイルサイズは2GB〜10GB程度になります。モデルの種類によって、生成される画像のスタイルや品質が大きく変わります。

代表的なモデル規格としては、Stable Diffusion 1.5、SDXL、Fluxがあります。SD 1.5は軽量で動作が速く、SDXLは高解像度に強い設計です。Fluxは2025年以降に登場した新世代モデルで、テキスト描画の精度やディテール表現に優れています。

用途別のモデル選定ガイド

どのモデルを選ぶかは、用途と手持ちのGPU性能で決まります。

写実的な画像を作りたい: SDXL系のリアリスティックモデル
アニメ・イラスト調にしたい: SD 1.5系またはSDXL系のアニメ特化モデル
テキストを含む画像を作りたい: Flux系モデル
軽量GPUで動かしたい: SD 1.5系（VRAM 4GBでも動作可能）

モデルの入手先や詳しい比較はComfyUI モデル完全ガイドで紹介しています。

ControlNetで構図を制御する

テキストプロンプトだけでは細かい構図指定が難しいところを補うのがControlNetです。ここでは役割の基本を押さえたあと、建築・インテリア分野での具体的な活用例につなげます。

ControlNetの役割

ControlNetは、画像生成の構図やポーズを制御するための追加モデルです。通常のテキストプロンプトだけでは「この角度から」「この構図で」といった細かい指定が難しいのですが、ControlNetを使えば参照画像の構造情報をもとに生成画像をコントロールできます。

たとえば、エッジ（輪郭線）検出で建物の形状を維持したまま質感だけを変えたり、深度（Depth）マップで空間の奥行きを指定したりできます。

建築・インテリア分野での活用例

建築パースの生成では、ControlNetが特に力を発揮します。手描きの間取り図やCAD図面をLineArtモードで読み取れば、その構造を維持した状態でリアルな内装イメージを生成できます。

また、IP-Adapterを併用すると、参照画像の「雰囲気」や「スタイル」を生成結果に反映させることも可能です。クライアントに「こんなイメージで」と見せる提案資料の作成に活用が広がっています。

ControlNetの具体的な導入方法と応用テクニックはComfyUI ControlNet・構図制御ガイドを参照してください。

カスタムノードで機能を拡張する

ComfyUIは標準機能だけでも十分に使えますが、カスタムノードを導入することで対応範囲が一気に広がります。ここでは仕組みを理解したうえで、最初に検討したい定番のカスタムノードへ進みます。

カスタムノードの仕組み

ComfyUIの標準ノードだけでも基本的な画像生成は可能ですが、カスタムノードを導入すると対応できる範囲が大幅に広がります。カスタムノードとは、コミュニティの開発者が作成した追加機能パッケージです。

2026年4月現在、1,000を超えるカスタムノードパッケージが公開されており、ComfyUI Managerを使えばワンクリックでインストールできます。

定番カスタムノードの紹介

初心者がまず導入を検討したいカスタムノードを紹介します。

ComfyUI Manager: カスタムノードの検索・インストール・更新を一元管理
ComfyUI Impact Pack: 顔の修復やマスク処理など実用的な機能の詰め合わせ
ComfyUI ControlNet Auxiliary: ControlNet用の前処理ノード群
AnimateDiff Evolved: 動画生成のためのAnimateDiff統合ノード

カスタムノードの選び方と導入手順はComfyUI カスタムノード・拡張ガイドで詳しく解説しています。

動画生成に挑戦する

ComfyUIは静止画だけでなく、短い動画クリップの生成にも対応しています。ここでは主要な2つの動画生成アプローチを紹介したあと、実際のワークフローの流れを概観します。

AnimateDiffとStable Video Diffusion

ComfyUIでの動画生成は、主に2つのアプローチで実現します。

AnimateDiff: 既存の画像生成モデルに動きの概念を追加するモジュールです。SD 1.5やSDXLベースのモデルと組み合わせて、テキストプロンプトから短いアニメーションを生成します。

Stable Video Diffusion（SVD）: Stability AIが開発した動画専用モデルです。1枚の静止画から自然な動きのある短い動画を生成できます。

2026年4月現在、WanVideoやCogVideoXなど新しい動画生成モデルも登場しており、品質と安定性は急速に向上しています。

動画生成ワークフローの概要

動画生成の基本的な流れは以下のとおりです。

ベースとなる画像やテキストプロンプトを用意する
AnimateDiffやSVDのモデルをワークフローに組み込む
フレーム数やFPS（フレームレート）を設定する
生成して動画ファイルとして書き出す

ControlNetと組み合わせれば、既存動画のポーズや動きを保ちながら見た目だけを差し替える「スタイル変換動画」も作成できます。動画生成の詳しい手順と推奨設定はComfyUI 動画生成ガイド【2026年版】モデル選びと実践ワークフローにまとめています。

建築パースへの活用

ComfyUIの強みが最も発揮される分野の一つが、建築パース生成です。ここでは間取り図からパースを生成する基本的な流れを示したうえで、実務で使う際の活用範囲と注意点を整理します。

間取り図から3Dパースを生成する流れ

ComfyUIを建築パース生成に活用する場合、一般的には以下の流れになります。

間取り図やCAD図面を画像として用意する
ControlNet（LineArtまたはDepthモード）で構造情報を抽出する
テキストプロンプトで素材感や照明の雰囲気を指定する
生成された画像を確認し、必要に応じてインペイントで部分修正する

手描きのラフスケッチからでもフォトリアルなパースを生成できるため、設計の初期段階で複数のイメージ案を素早く比較検討する用途に適しています。

AIパースの実務活用と注意点

AIで生成した建築パースは、提案資料やイメージ共有の場面で威力を発揮します。クライアントへの初期提案や社内での方向性すり合わせに使えば、意思決定のスピードが格段に上がります。

ただし、現時点のAIパースには寸法の正確性や建築法規への準拠を保証する機能はありません。最終的な設計図書には従来の3DCGソフトやCADでの作り込みが必要です。AIパースはあくまで「アイデアの可視化ツール」として位置づけるのが現実的です。

建築パース生成の具体的なワークフローとモデル選定はComfyUI×建築パース生成完全ガイドで解説しています。

ワークフローの管理と自動化

ComfyUIを継続的に活用していくと、作成したワークフローの管理と処理の自動化が課題になります。ここではワークフローの保存・共有の仕組みから、API連携による大量処理への発展までを順に紹介します。

ワークフローの保存・共有

ComfyUIのワークフローはJSON形式で保存できます。ファイルを共有するだけで、別のPCやチームメンバーの環境で同じワークフローを再現可能です。

さらに、生成した画像のメタデータにワークフロー情報が自動で埋め込まれるため、画像ファイルそのものがワークフローの記録になります。SNSやフォーラムで見かけた作品の画像をComfyUIにドラッグ&ドロップすれば、その設定をすぐに再現できます。

最近ではNodes 2.0とSubgraph機能も導入され、ワークフローの一部をモジュール化して再利用する仕組みも整ってきました。

API連携とバッチ処理

ComfyUIにはAPIモードがあり、外部のプログラムからワークフローを実行できます。Pythonスクリプトと連携すれば、大量の画像を自動で生成するバッチ処理も構築可能です。

たとえば、100パターンの間取り図に対して自動でパースを生成する、商品画像のバリエーションを一括で作成するといった使い方ができます。

ワークフロー管理の実践テクニックとAPI活用はComfyUI ワークフロー管理・自動化ガイドを参照してください。

ComfyUI学習ロードマップ

ComfyUIの機能は幅広いため、段階的に学んでいくのが効果的です。ここでは初級・中級・上級の3ステップで学習の道筋を示します。

初級: 導入から基本操作まで

まずはComfyUIをインストールし、基本のtxt2imgワークフローで画像を生成するところまでを目指します。

ComfyUIの導入と初期設定 → ComfyUI 導入・環境構築ガイド
PC環境の確認と最適化 → ComfyUI PC環境・ローカル生成ガイド
ノードの基本操作を覚える → ComfyUI ノード基礎・基本ワークフローガイド
モデルの選び方を理解する → ComfyUI モデル完全ガイド

この段階でComfyUIの操作に慣れておくと、次のステップにスムーズに進めます。

中級: ControlNet・カスタムノード活用

基本操作ができるようになったら、ControlNetやカスタムノードを使って生成品質を高めていきます。

ControlNetで構図を制御する → ComfyUI ControlNet・構図制御ガイド
カスタムノードを導入する → ComfyUI カスタムノード・拡張ガイド

この段階まで進めば、実務レベルの画像生成が可能になります。建築パースの生成もここから本格的に取り組めます。

上級: 動画生成・API連携・自動化

さらに応用範囲を広げるなら、動画生成やAPI連携に挑戦してみてください。

動画生成ワークフローを構築する → ComfyUI 動画生成ガイド【2026年版】モデル選びと実践ワークフロー
建築パース生成を実務に組み込む → ComfyUI×建築パース生成完全ガイド
ワークフローの管理と自動化を習得する → ComfyUI ワークフロー管理・自動化ガイド

学習リソースの一覧はComfyUI学習リソースまとめにも整理しています。自分のペースで一つずつ取り組んでいきましょう。

まとめ

ComfyUIとは、ノードベースの操作で画像生成AIを自在にコントロールできるオープンソースツールです。テキストからの画像生成、動画生成、建築パースの作成まで、幅広い用途に対応しています。

ワークフローの完全な再現性と1,000を超えるカスタムノードのエコシステムが、ComfyUIを他のツールと一線を画す存在にしています。まずはデスクトップ版をインストールし、基本のtxt2imgワークフローから始めてみてください。

一度基本をつかめば、ControlNetによる構図制御、カスタムノードによる機能拡張、動画生成へと自然にステップアップしていけます。この記事で紹介したロードマップを参考に、自分の目的に合った学習を進めていきましょう。

この記事を書いた人

橘美咲 PERSC 専任講師

「CADは裏切らない。昨日引けなかった線が、今日は引ける。それが楽しいの」

元・完全未経験の文系女子。新卒で入った建築現場で「図面が読めない」と絶望し、悔し涙を流しながらCADを独学で習得した過去を持つ。その後、設計事務所、ゼネコンを経てフリーランスへ転身。現在はPERSCにて「現場で本当に使える技術」を伝授する鬼（？）コーチとして活動中。「線一本にも意味がある」が口癖。趣味は、完成した建物を見上げながらのビールと、深夜の猫動画巡回。

この著者の記事一覧へ

ComfyUI完全解説ガイド できること・始め方・学習ロードマップ

Blenderで作る初めての建築3DCGパース