ComfyUI モデル完全ガイド|Flux・LoRA等5種の選び方
ComfyUI(ノードをつないで画像生成AIを動かすツール)で画像を生成するには、複数のモデルファイルを組み合わせる必要があります。チェックポイント、Flux、VAE、LoRA、Embeddings。名前だけ見ても、それぞれが何をしているのかわかりにくいのではないでしょうか。
さらに厄介なのは、モデル間の互換性です。SD1.5用のLoRAはSDXLでは動きませんし、VAEにも世代の区別があります。正しい組み合わせを知らないまま試行錯誤すると、エラーや品質低下で時間を浪費しがちです。建築パースでいうと「3DソフトとレンダラとCADの対応バージョンが揃っていない」状態に近く、1つでも噛み合わないと作業が止まります。
この記事では、ComfyUIで扱う主要モデルを5つのカテゴリに分類し、それぞれの役割と互換性ルール、VRAM帯別の選び方、入手方法までを1本で整理します。各モデルの詳しい設定方法はそれぞれの専門記事で解説しているので、まずは全体像をつかむ地図としてお使いください。
ComfyUIで使うモデル5種類の役割
モデルファイルの関係は、建築プロジェクトの資材構成に似ています。構造材(チェックポイント)があり、仕上げ材(VAE)があり、オプションのアクセント材(LoRA)があり、細かい指示書(Embeddings)がある。それぞれ役割が違うので、一括りに「モデル」と呼ぶと混乱します。ComfyUIで使うモデルファイルは、大きく5つのカテゴリに分かれます。
| カテゴリ | 役割 | ファイルサイズ目安 | 配置先 |
|---|---|---|---|
| チェックポイント | 画像生成の土台となる学習済みモデル | 2〜16GB | models/checkpoints/ |
| Flux | 次世代アーキテクチャの画像生成モデル | 12〜24GB | models/checkpoints/ または models/unet/ |
| VAE | 潜在空間と画像を相互変換する | 300MB〜800MB | models/vae/ |
| LoRA | 画風やテーマを軽量に追加学習する | 数十MB〜数百MB | models/loras/ |
| Embeddings | プロンプト空間でスタイルや品質を補正する | 数十KB〜数百KB | models/embeddings/ |
チェックポイントモデル:画像生成の土台
チェックポイントモデルは、大量の画像データで学習済みの重みファイルです。ComfyUIの「Load Checkpoint」ノードで読み込むと、テキストからの画像生成が可能になります。建物の構造体に相当する最重要パーツで、ここを間違えるとあとから何を追加しても挽回できません。
Stability AIが公式リリースしたSD1.5、SDXL、SD3.5が主要な世代です。世代ごとにパラメータ数や推奨解像度、必要VRAMが大きく違います。SD1.5は4GB VRAMから動作する軽量モデル、SDXLは8GB以上で1024×1024の高解像度を実現、SD3.5は最新アーキテクチャで高品質ですがVRAM要件も高めです。
CivitAIではSD系の派生モデルも数多く公開されています。リアル系に特化した「CyberRealistic」や、SDXLベースの「Pony Diffusion」など、用途特化のモデルが豊富に揃っている状況です(2026年4月現在)。
チェックポイントの詳しい選び方はチェックポイントモデルの違い|SD1.5・SDXL・SD3の選び方で解説しています。
Fluxモデル:次世代アーキテクチャ
Fluxは、Stable Diffusionの生みの親が設立したBlack Forest Labsが開発した画像生成モデルです。12Bパラメータの大規模構成で、プロンプトへの忠実度と画像品質の両面でSD系を超える評価を得ています。
FLUX.1にはDev(高品質・非商用)、Schnell(高速・Apache 2.0)、Pro(API限定)の3モデルがあります。2025年11月にリリースされたFLUX.2は32Bパラメータへ拡大し、マルチリファレンスやテキストレンダリングが強化されました。コミュニティ発のChromaも商用可能なオープンモデルとして選択肢に入ります(2026年4月現在)。
SD系と違って、FluxはT5-XXLとCLIP-Lの2系統テキストエンコーダを使い、ネガティブプロンプトが不要な点が特徴です。ComfyUIでは「DualCLIPLoader」ノードで両方を読み込む構成になります。
画像の部分編集に特化したFlux Kontextも登場しています。マスクを描かずテキスト指示だけで画像の一部を書き換えられるモデルで、建築パースの素材変更やインテリアの家具差し替えで使われています。詳しくはFluxモデル完全ガイド|Dev・Schnell・FLUX.2・ChromaとFlux Kontext 画像編集ワークフロー|部分編集・スタイル変換で解説しています。
VAE:潜在空間と画像の橋渡し
VAE(Variational Autoencoder)は、AIが内部で扱う圧縮データと目に見える画像を相互に変換するパーツです。画像生成の「最後の仕上げ」を担い、VAEの品質が低ければ色がくすんだりディテールがぼやけたりします。建築でいえば仕上げ塗装に近く、土台が同じでも仕上げ材で印象が大きく変わります。
多くのチェックポイントにはVAEが内蔵されていますが、外部VAEに切り替えるだけで色味や鮮明さが向上するケースが少なくありません。SD1.5系ならvae-ft-mse-840000、SDXL系ならsdxl-vae-fp16-fix、Flux系ならae.safetensorsが定番の選択肢です。
大切なのは、チェックポイントの世代とVAEの世代を必ず合わせること。SD1.5/SDXLは4チャネル、Fluxは16チャネルの潜在空間で構築されており、世代を跨ぐと画像が破綻します。
VAEの詳細はVAEの役割と選び方|色味・ディテールへの影響で解説しています。
LoRA:軽量な追加学習アダプター
LoRA(Low-Rank Adaptation)は、チェックポイントモデルを差し替えずに特定の画風やテーマを追加できる技術です。ファイルサイズは数十MB〜数百MBと軽く、「Load LoRA」ノードでチェックポイントとサンプラーの間に挟む形で接続します。CADでいえばテンプレートに後から追加する「スタイル設定ファイル」に近い位置づけになります。
strength_model(画像生成パスへの影響度)とstrength_clip(テキスト理解への影響度)の2つのパラメータで効果を調整できます。複数のLoRAを直列接続して重ね掛けすることも可能ですが、strengthの合計値が大きくなりすぎると画像が破綻するため注意が必要です。
建築・インテリア分野では、素材の質感やインテリアスタイルに特化したLoRAが公開されており、プロンプトだけでは表現しにくい画風の安定化に効果を発揮します。詳細はComfyUI LoRAの使い方|導入から建築向けおすすめの選び方で解説しています。
Embeddings:プロンプト空間のカスタマイズ
Embeddings(Textual Inversion)は、特定の概念やスタイルを1つのトークンに圧縮し、プロンプトに追加するだけで効果を発揮する技術です。ファイルサイズは数十KB〜数百KBと最も軽量で、モデル本体の重みには一切手を加えません。
特に広く使われているのが、ネガティブプロンプト用のEmbeddingsです。EasyNegativeやFastNegativeV2といったモデルをembedding:EasyNegativeのように記述するだけで、低品質・ぼやけ・不自然な構図を一括で抑制できます。
ただし、SD1.5用のEmbeddingsはSDXLでは動作しません。テキストエンコーダの次元構造が違うためです。ダウンロード時に対応バージョンを確認し、フォルダを分けて管理するのが安全な運用になります。ComfyUI Embeddingsの使い方|導入から建築パース活用まで解説で導入手順を整理しています。
モデル世代とアーキテクチャ互換性
互換性のルールは、CADソフトのファイル形式互換に似ています。ここを押さえておくと、ダウンロードの段階でのミスが大幅に減ります。
SD1.5・SDXL・SD3.5・Fluxの互換ルール
ComfyUIで最もよくあるトラブルが、モデル世代の不一致によるエラーや画像破綻です。SD1.5、SDXL、SD3.5、Fluxは、それぞれアーキテクチャが根本的に違います。
以下の互換マトリクスを押さえておけば、組み合わせミスを防げます(2026年4月現在)。
| 組み合わせ | SD1.5用 | SDXL用 | SD3.5用 | Flux用 |
|---|---|---|---|---|
| SD1.5チェックポイント | 使用可能 | 不可 | 不可 | 不可 |
| SDXLチェックポイント | 不可 | 使用可能 | 不可 | 不可 |
| SD3.5チェックポイント | 不可 | 不可 | 使用可能 | 不可 |
| Fluxモデル | 不可 | 不可 | 不可 | 使用可能 |
LoRA、VAE、Embeddingsのすべてがこのルールに従います。SD1.5用のLoRAをSDXLモデルにロードしてもエラーになるか、意図しない出力になるだけです。CivitAIでダウンロードするときは、配布ページの「Base Model」欄を必ず確認してください。
モデル同士の組み合わせで注意すべき点
互換ルール以外にも、実務で意識しておきたいポイントがあります。
VAEの世代合わせ: チェックポイント内蔵VAEで色がくすむ場合に外部VAEへ切り替えるのは有効ですが、世代違いのVAEを接続すると灰色の画像が出力されます。海外の事例集計では、生成画像の色異常の約99%がVAEミスマッチに起因するとされています。
LoRAの重ね掛けルール: 複数LoRAを直列接続する場合、すべて同一アーキテクチャ用で揃える必要があります。SD1.5用とSDXL用を混在させることはできません。
テキストエンコーダの違い: SD1.5はCLIPを1つ、SDXLはCLIPを2つ、Fluxはt5-XXL+CLIP-Lという構成です。Embeddingsはテキストエンコーダの次元に依存するため、違う世代間では流用できません。この仕様がモデル互換性の根本原因です。
用途別モデルの選び方
手持ちのPCで何が動くかは、手持ちの工具で何が作れるかと同じです。軽量な電動ドライバーしかなければ小物家具は作れますが、大型の造作家具には対応できません。同じようにVRAM容量が使えるモデルの範囲を決めるので、まず自分のGPUを確認してから選んでください。
VRAM別のおすすめ構成
どのモデルを使えるかは、GPUのVRAM容量で決まります。以下はVRAM帯別の推奨構成です(2026年4月現在)。
| VRAM | チェックポイント | Flux | VAE | 備考 |
|---|---|---|---|---|
| 4〜6GB | SD1.5系 | 非推奨 | vae-ft-mse-840000 | 学習・プロトタイプ向け |
| 8〜12GB | SDXL系 | GGUF Q4量子化版 | sdxl-vae-fp16-fix | 実務の主力環境 |
| 12〜16GB | SDXL / SD3.5 Medium | FP8量子化版 | 世代に合わせて選択 | 高品質生成が可能 |
| 16〜24GB+ | SD3.5 Large | FP16フル精度版 | ae.safetensors(Flux用) | 最高品質環境 |
VRAM 8GBクラスでFluxを動かしたい場合は、モデル本体のGGUF Q4量子化とT5-XXLのFP8版を組み合わせることで実用ラインに入ります。FP8やGGUF量子化の詳細はFluxモデル完全ガイドで解説しています。
建築パース・インテリア向けの組み合わせ
建築パースやインテリアCGの生成では、解像度と素材表現の精度が大切になります。
建築パース用途では、SDXLチェックポイント + 建築系LoRA + sdxl-vae-fp16-fixの組み合わせが扱いやすい基本構成です。SDXLは1024×1024のネイティブ解像度と充実したエコシステムを持ち、ControlNetによる構図制御との相性も良好。2026年4月現在、商用利用可能な派生モデルも豊富に揃っています。
Fluxモデルは木目やコンクリートなどのテクスチャ表現力に優れており、文字レンダリングも高精度です。VRAM 12GB以上の環境であれば、Flux DevのFP8量子化版を検証用に併用するのも効果があります。
素材変更や家具差し替えの検討には、Flux Kontextがマスク不要で直感的に使えます。「床をオーク無垢材からマイクロセメントに変更」のようなテキスト指示だけで部分編集できるので、クライアントへの提案パターン作成が効率化します。
モデルの入手先と配置方法
モデル入手の使い分けは、建材の調達先の選び分けに近いものです。コミュニティメイドのバリエーション豊富なCivitAI、メーカー純正品が揃うHuggingFace、そして公式ツール向けのComfy Registry。それぞれ得意分野が違うので、目的に応じて選びます。
CivitAI・HuggingFace・Comfy Registryの使い分け
モデルの入手先は主に3つあります(2026年4月現在)。
CivitAIは、コミュニティが制作したチェックポイント・LoRA・Embeddingsが最も充実しています。サンプル画像やユーザーレビューで品質を確認してからダウンロードできる点が強み。ベースモデルでフィルタをかけて互換性のあるモデルだけを絞り込めるので、世代違いのダウンロードミスを防げます。
HuggingFaceは、Stability AIやBlack Forest Labsなど開発元が公式モデルを直接公開しています。モデルカードにライセンス情報や技術仕様が明記されており、信頼性が高い入手先。safetensors形式のファイルを優先してダウンロードしてください。
Comfy Registryは、主にカスタムノードの配布基盤です。ComfyUI公式チームが公開するモデルは、HuggingFace上のComfy-Orgリポジトリに集約されています。
ダウンロードするときに忘れてはならないのがライセンスの確認です。たとえばFLUX.1 DevとSchnellではライセンスがまったく違い、Dev版は非商用限定、Schnell版はApache 2.0で商用利用可能です。商用プロジェクトで使う場合は、ライセンス原文を一度通読しておくと安心です。
安全面では、safetensors形式のファイルを優先する運用が2026年時点の標準的な選び方です。従来のpickle形式(.ckpt)にはコード実行のリスクがあり、picklescanのバイパス手法も報告されています。入手先の詳細はモデル入手先ガイド|CivitAI・HuggingFace・Comfy Registryで整理しています。
ディレクトリ構成と命名のコツ
ダウンロードしたモデルは、種別ごとに所定のディレクトリへ配置します。ComfyUIを再起動すれば、ノードのドロップダウンに表示されます。
ComfyUI/models/
├── checkpoints/ ← チェックポイント
│ ├── sd15/
│ ├── sdxl/
│ └── flux/
├── loras/ ← LoRA
├── vae/ ← VAE
│ ├── sd15/
│ ├── sdxl/
│ └── flux/
├── embeddings/ ← Embeddings
│ ├── SD1.5/
│ └── SDXL/
└── unet/ ← Flux GGUF版
世代別にサブフォルダを切っておくと、LoRAやVAEの世代違い誤選択を防げます。モデル数が増えたときの管理しやすさも大きく変わるため、最初の段階から整理しておくのがおすすめです。
まとめ
ComfyUIで扱うモデルは、チェックポイント、Flux、VAE、LoRA、Embeddingsの5カテゴリに分かれます。それぞれが画像生成のどの工程を担うかを理解しておけば、適切なモデル選びと組み合わせができるようになります。
最も大切なルールは、モデル世代の互換性を守ること。SD1.5・SDXL・SD3.5・Fluxはアーキテクチャが違うため、LoRA・VAE・Embeddingsは同じ世代のものを使ってください。VRAM容量に合わせてチェックポイントの世代やFluxの量子化レベルを選べば、ミドルクラスのGPUでも実用的な画像生成ができます。
モデルの入手先はCivitAI・HuggingFace・Comfy-Org HFリポジトリが基本。ライセンスとsafetensors形式の確認を忘れずに、まずは自分のVRAMに合ったモデル構成から始めてみてください。
あわせて読みたい
- チェックポイントモデルの違い|SD1.5・SDXL・SD3の選び方 — SD系チェックポイントの世代比較と用途別選び方を詳しく知りたい方へ
- Fluxモデル完全ガイド|Dev・Schnell・FLUX.2・Chroma — Flux系モデルの導入手順と量子化設定を押さえたい方へ
- Flux Kontext 画像編集ワークフロー|部分編集・スタイル変換 — テキスト指示で画像を部分編集したい方へ
- VAEの役割と選び方|色味・ディテールへの影響 — 色味やディテールの改善にVAEを活用したい方へ
- ComfyUI LoRAの使い方|導入から建築向けおすすめの選び方 — LoRAの接続方法やstrength調整を実践したい方へ
- ComfyUI Embeddingsの使い方|導入から建築パース活用まで解説 — ネガティブEmbeddingsで品質を底上げしたい方へ
- モデル入手先ガイド|CivitAI・HuggingFace・Comfy Registry — モデルの安全なダウンロード先と配置方法を確認したい方へ
- ComfyUI完全ガイド — ComfyUIの全体像をピラーページから通して把握したい方へ




