ComfyUI モデル完全ガイド|Flux・LoRA等5種の選び方

ComfyUI(ノードをつないで画像生成AIを動かすツール)で画像を生成するには、複数のモデルファイルを組み合わせる必要があります。チェックポイント、Flux、VAE、LoRA、Embeddings。名前だけ見ても、それぞれが何をしているのかわかりにくいのではないでしょうか。

さらに厄介なのは、モデル間の互換性です。SD1.5用のLoRAはSDXLでは動きませんし、VAEにも世代の区別があります。正しい組み合わせを知らないまま試行錯誤すると、エラーや品質低下で時間を浪費しがちです。建築パースでいうと「3DソフトとレンダラとCADの対応バージョンが揃っていない」状態に近く、1つでも噛み合わないと作業が止まります。

この記事では、ComfyUIで扱う主要モデルを5つのカテゴリに分類し、それぞれの役割と互換性ルール、VRAM帯別の選び方、入手方法までを1本で整理します。各モデルの詳しい設定方法はそれぞれの専門記事で解説しているので、まずは全体像をつかむ地図としてお使いください。

Blenderで作る
初めての建築3DCGパース

Blenderの導入から基本操作、太陽光の入る白い部屋の制作まで。全3本のカリキュラムを体験できます。

Blenderの導入から基本操作、
太陽光の入る白い部屋の制作まで。
全3本のカリキュラムを体験できます。

目次

ComfyUIで使うモデル5種類の役割

モデルファイルの関係は、建築プロジェクトの資材構成に似ています。構造材(チェックポイント)があり、仕上げ材(VAE)があり、オプションのアクセント材(LoRA)があり、細かい指示書(Embeddings)がある。それぞれ役割が違うので、一括りに「モデル」と呼ぶと混乱します。ComfyUIで使うモデルファイルは、大きく5つのカテゴリに分かれます。

カテゴリ 役割 ファイルサイズ目安 配置先
チェックポイント 画像生成の土台となる学習済みモデル 2〜16GB models/checkpoints/
Flux 次世代アーキテクチャの画像生成モデル 12〜24GB models/checkpoints/ または models/unet/
VAE 潜在空間と画像を相互変換する 300MB〜800MB models/vae/
LoRA 画風やテーマを軽量に追加学習する 数十MB〜数百MB models/loras/
Embeddings プロンプト空間でスタイルや品質を補正する 数十KB〜数百KB models/embeddings/

チェックポイントモデル:画像生成の土台

チェックポイントモデルは、大量の画像データで学習済みの重みファイルです。ComfyUIの「Load Checkpoint」ノードで読み込むと、テキストからの画像生成が可能になります。建物の構造体に相当する最重要パーツで、ここを間違えるとあとから何を追加しても挽回できません。

Stability AIが公式リリースしたSD1.5、SDXL、SD3.5が主要な世代です。世代ごとにパラメータ数や推奨解像度、必要VRAMが大きく違います。SD1.5は4GB VRAMから動作する軽量モデル、SDXLは8GB以上で1024×1024の高解像度を実現、SD3.5は最新アーキテクチャで高品質ですがVRAM要件も高めです。

CivitAIではSD系の派生モデルも数多く公開されています。リアル系に特化した「CyberRealistic」や、SDXLベースの「Pony Diffusion」など、用途特化のモデルが豊富に揃っている状況です(2026年4月現在)。

チェックポイントの詳しい選び方はチェックポイントモデルの違い|SD1.5・SDXL・SD3の選び方で解説しています。

Fluxモデル:次世代アーキテクチャ

Fluxは、Stable Diffusionの生みの親が設立したBlack Forest Labsが開発した画像生成モデルです。12Bパラメータの大規模構成で、プロンプトへの忠実度と画像品質の両面でSD系を超える評価を得ています。

FLUX.1にはDev(高品質・非商用)、Schnell(高速・Apache 2.0)、Pro(API限定)の3モデルがあります。2025年11月にリリースされたFLUX.2は32Bパラメータへ拡大し、マルチリファレンスやテキストレンダリングが強化されました。コミュニティ発のChromaも商用可能なオープンモデルとして選択肢に入ります(2026年4月現在)。

SD系と違って、FluxはT5-XXLとCLIP-Lの2系統テキストエンコーダを使い、ネガティブプロンプトが不要な点が特徴です。ComfyUIでは「DualCLIPLoader」ノードで両方を読み込む構成になります。

画像の部分編集に特化したFlux Kontextも登場しています。マスクを描かずテキスト指示だけで画像の一部を書き換えられるモデルで、建築パースの素材変更やインテリアの家具差し替えで使われています。詳しくはFluxモデル完全ガイド|Dev・Schnell・FLUX.2・ChromaFlux Kontext 画像編集ワークフロー|部分編集・スタイル変換で解説しています。

VAE:潜在空間と画像の橋渡し

VAE(Variational Autoencoder)は、AIが内部で扱う圧縮データと目に見える画像を相互に変換するパーツです。画像生成の「最後の仕上げ」を担い、VAEの品質が低ければ色がくすんだりディテールがぼやけたりします。建築でいえば仕上げ塗装に近く、土台が同じでも仕上げ材で印象が大きく変わります。

多くのチェックポイントにはVAEが内蔵されていますが、外部VAEに切り替えるだけで色味や鮮明さが向上するケースが少なくありません。SD1.5系ならvae-ft-mse-840000、SDXL系ならsdxl-vae-fp16-fix、Flux系ならae.safetensorsが定番の選択肢です。

大切なのは、チェックポイントの世代とVAEの世代を必ず合わせること。SD1.5/SDXLは4チャネル、Fluxは16チャネルの潜在空間で構築されており、世代を跨ぐと画像が破綻します。

VAEの詳細はVAEの役割と選び方|色味・ディテールへの影響で解説しています。

LoRA:軽量な追加学習アダプター

LoRA(Low-Rank Adaptation)は、チェックポイントモデルを差し替えずに特定の画風やテーマを追加できる技術です。ファイルサイズは数十MB〜数百MBと軽く、「Load LoRA」ノードでチェックポイントとサンプラーの間に挟む形で接続します。CADでいえばテンプレートに後から追加する「スタイル設定ファイル」に近い位置づけになります。

strength_model(画像生成パスへの影響度)とstrength_clip(テキスト理解への影響度)の2つのパラメータで効果を調整できます。複数のLoRAを直列接続して重ね掛けすることも可能ですが、strengthの合計値が大きくなりすぎると画像が破綻するため注意が必要です。

建築・インテリア分野では、素材の質感やインテリアスタイルに特化したLoRAが公開されており、プロンプトだけでは表現しにくい画風の安定化に効果を発揮します。詳細はComfyUI LoRAの使い方|導入から建築向けおすすめの選び方で解説しています。

Embeddings:プロンプト空間のカスタマイズ

Embeddings(Textual Inversion)は、特定の概念やスタイルを1つのトークンに圧縮し、プロンプトに追加するだけで効果を発揮する技術です。ファイルサイズは数十KB〜数百KBと最も軽量で、モデル本体の重みには一切手を加えません。

特に広く使われているのが、ネガティブプロンプト用のEmbeddingsです。EasyNegativeやFastNegativeV2といったモデルをembedding:EasyNegativeのように記述するだけで、低品質・ぼやけ・不自然な構図を一括で抑制できます。

ただし、SD1.5用のEmbeddingsはSDXLでは動作しません。テキストエンコーダの次元構造が違うためです。ダウンロード時に対応バージョンを確認し、フォルダを分けて管理するのが安全な運用になります。ComfyUI Embeddingsの使い方|導入から建築パース活用まで解説で導入手順を整理しています。

モデル世代とアーキテクチャ互換性

互換性のルールは、CADソフトのファイル形式互換に似ています。ここを押さえておくと、ダウンロードの段階でのミスが大幅に減ります。

SD1.5・SDXL・SD3.5・Fluxの互換ルール

ComfyUIで最もよくあるトラブルが、モデル世代の不一致によるエラーや画像破綻です。SD1.5、SDXL、SD3.5、Fluxは、それぞれアーキテクチャが根本的に違います。

以下の互換マトリクスを押さえておけば、組み合わせミスを防げます(2026年4月現在)。

組み合わせ SD1.5用 SDXL用 SD3.5用 Flux用
SD1.5チェックポイント 使用可能 不可 不可 不可
SDXLチェックポイント 不可 使用可能 不可 不可
SD3.5チェックポイント 不可 不可 使用可能 不可
Fluxモデル 不可 不可 不可 使用可能

LoRA、VAE、Embeddingsのすべてがこのルールに従います。SD1.5用のLoRAをSDXLモデルにロードしてもエラーになるか、意図しない出力になるだけです。CivitAIでダウンロードするときは、配布ページの「Base Model」欄を必ず確認してください。

モデル同士の組み合わせで注意すべき点

互換ルール以外にも、実務で意識しておきたいポイントがあります。

VAEの世代合わせ: チェックポイント内蔵VAEで色がくすむ場合に外部VAEへ切り替えるのは有効ですが、世代違いのVAEを接続すると灰色の画像が出力されます。海外の事例集計では、生成画像の色異常の約99%がVAEミスマッチに起因するとされています。

LoRAの重ね掛けルール: 複数LoRAを直列接続する場合、すべて同一アーキテクチャ用で揃える必要があります。SD1.5用とSDXL用を混在させることはできません。

テキストエンコーダの違い: SD1.5はCLIPを1つ、SDXLはCLIPを2つ、Fluxはt5-XXL+CLIP-Lという構成です。Embeddingsはテキストエンコーダの次元に依存するため、違う世代間では流用できません。この仕様がモデル互換性の根本原因です。

用途別モデルの選び方

手持ちのPCで何が動くかは、手持ちの工具で何が作れるかと同じです。軽量な電動ドライバーしかなければ小物家具は作れますが、大型の造作家具には対応できません。同じようにVRAM容量が使えるモデルの範囲を決めるので、まず自分のGPUを確認してから選んでください。

VRAM別のおすすめ構成

どのモデルを使えるかは、GPUのVRAM容量で決まります。以下はVRAM帯別の推奨構成です(2026年4月現在)。

VRAM チェックポイント Flux VAE 備考
4〜6GB SD1.5系 非推奨 vae-ft-mse-840000 学習・プロトタイプ向け
8〜12GB SDXL系 GGUF Q4量子化版 sdxl-vae-fp16-fix 実務の主力環境
12〜16GB SDXL / SD3.5 Medium FP8量子化版 世代に合わせて選択 高品質生成が可能
16〜24GB+ SD3.5 Large FP16フル精度版 ae.safetensors(Flux用) 最高品質環境

VRAM 8GBクラスでFluxを動かしたい場合は、モデル本体のGGUF Q4量子化とT5-XXLのFP8版を組み合わせることで実用ラインに入ります。FP8やGGUF量子化の詳細はFluxモデル完全ガイドで解説しています。

建築パース・インテリア向けの組み合わせ

建築パースやインテリアCGの生成では、解像度と素材表現の精度が大切になります。

建築パース用途では、SDXLチェックポイント + 建築系LoRA + sdxl-vae-fp16-fixの組み合わせが扱いやすい基本構成です。SDXLは1024×1024のネイティブ解像度と充実したエコシステムを持ち、ControlNetによる構図制御との相性も良好。2026年4月現在、商用利用可能な派生モデルも豊富に揃っています。

Fluxモデルは木目やコンクリートなどのテクスチャ表現力に優れており、文字レンダリングも高精度です。VRAM 12GB以上の環境であれば、Flux DevのFP8量子化版を検証用に併用するのも効果があります。

素材変更や家具差し替えの検討には、Flux Kontextがマスク不要で直感的に使えます。「床をオーク無垢材からマイクロセメントに変更」のようなテキスト指示だけで部分編集できるので、クライアントへの提案パターン作成が効率化します。

モデルの入手先と配置方法

モデル入手の使い分けは、建材の調達先の選び分けに近いものです。コミュニティメイドのバリエーション豊富なCivitAI、メーカー純正品が揃うHuggingFace、そして公式ツール向けのComfy Registry。それぞれ得意分野が違うので、目的に応じて選びます。

CivitAI・HuggingFace・Comfy Registryの使い分け

モデルの入手先は主に3つあります(2026年4月現在)。

CivitAIは、コミュニティが制作したチェックポイント・LoRA・Embeddingsが最も充実しています。サンプル画像やユーザーレビューで品質を確認してからダウンロードできる点が強み。ベースモデルでフィルタをかけて互換性のあるモデルだけを絞り込めるので、世代違いのダウンロードミスを防げます。

HuggingFaceは、Stability AIやBlack Forest Labsなど開発元が公式モデルを直接公開しています。モデルカードにライセンス情報や技術仕様が明記されており、信頼性が高い入手先。safetensors形式のファイルを優先してダウンロードしてください。

Comfy Registryは、主にカスタムノードの配布基盤です。ComfyUI公式チームが公開するモデルは、HuggingFace上のComfy-Orgリポジトリに集約されています。

ダウンロードするときに忘れてはならないのがライセンスの確認です。たとえばFLUX.1 DevとSchnellではライセンスがまったく違い、Dev版は非商用限定、Schnell版はApache 2.0で商用利用可能です。商用プロジェクトで使う場合は、ライセンス原文を一度通読しておくと安心です。

安全面では、safetensors形式のファイルを優先する運用が2026年時点の標準的な選び方です。従来のpickle形式(.ckpt)にはコード実行のリスクがあり、picklescanのバイパス手法も報告されています。入手先の詳細はモデル入手先ガイド|CivitAI・HuggingFace・Comfy Registryで整理しています。

ディレクトリ構成と命名のコツ

ダウンロードしたモデルは、種別ごとに所定のディレクトリへ配置します。ComfyUIを再起動すれば、ノードのドロップダウンに表示されます。

ComfyUI/models/
├── checkpoints/   ← チェックポイント
│   ├── sd15/
│   ├── sdxl/
│   └── flux/
├── loras/         ← LoRA
├── vae/           ← VAE
│   ├── sd15/
│   ├── sdxl/
│   └── flux/
├── embeddings/    ← Embeddings
│   ├── SD1.5/
│   └── SDXL/
└── unet/          ← Flux GGUF版

世代別にサブフォルダを切っておくと、LoRAやVAEの世代違い誤選択を防げます。モデル数が増えたときの管理しやすさも大きく変わるため、最初の段階から整理しておくのがおすすめです。

まとめ

ComfyUIで扱うモデルは、チェックポイント、Flux、VAE、LoRA、Embeddingsの5カテゴリに分かれます。それぞれが画像生成のどの工程を担うかを理解しておけば、適切なモデル選びと組み合わせができるようになります。

最も大切なルールは、モデル世代の互換性を守ること。SD1.5・SDXL・SD3.5・Fluxはアーキテクチャが違うため、LoRA・VAE・Embeddingsは同じ世代のものを使ってください。VRAM容量に合わせてチェックポイントの世代やFluxの量子化レベルを選べば、ミドルクラスのGPUでも実用的な画像生成ができます。

モデルの入手先はCivitAI・HuggingFace・Comfy-Org HFリポジトリが基本。ライセンスとsafetensors形式の確認を忘れずに、まずは自分のVRAMに合ったモデル構成から始めてみてください。

あわせて読みたい

この記事が気に入ったら
フォローしてね!

よかったらシェアしてね!
  • URLをコピーしました!

PERSC Experience Course

未経験から、
最初の一枚を完成させる。

未経験から、
最初の一枚を完成させる。

Blenderの導入から基本操作、
そして建築パースを1作品完成させるところまで。
全3本の体験カリキュラムを無料体験できます。

Blenderの導入から基本操作、
そして建築パースを1作品完成させるところまで。
全3本の体験カリキュラムを無料体験できます。


CONTENTS

3 LESSONS


基礎編① インストール&7項目の初期設定

Blenderの導入から制作に必要な基本設定

基礎編② 画面構成と基本的な操作方法

未経験でも迷わない画面の見方と操作の基本

実践編① 太陽光の入る白い部屋

建築パースを1作品完成させるまでを体験


BONUSES
体験カリキュラム限定の3大特典


実践編完成データ(.blend)

ショートカット・チートシート

マテリアル ライブラリセット

この記事を書いた人

橘 美咲のアバター 橘 美咲 PERSC 専任講師

「CADは裏切らない。昨日引けなかった線が、今日は引ける。それが楽しいの」

元・完全未経験の文系女子。新卒で入った建築現場で「図面が読めない」と絶望し、悔し涙を流しながらCADを独学で習得した過去を持つ。 その後、設計事務所、ゼネコンを経てフリーランスへ転身。現在はPERSCにて「現場で本当に使える技術」を伝授する鬼(?)コーチとして活動中。 「線一本にも意味がある」が口癖。趣味は、完成した建物を見上げながらのビールと、深夜の猫動画巡回。

目次