VAEの役割と選び方｜色味・ディテールへの影響

2026年4月23日

ComfyUI（ノードをつないで画像生成AIを動かすツール）で画像を生成したとき、色がくすむ、ディテールがぼやける、という経験はないでしょうか。その原因の多くはVAE（Variational Autoencoder。AI内部データと画像を相互変換するパーツ）の設定にあります。VAEは、AIが内部で扱う「潜在空間」のデータと、私たちが目にする画像を相互に変換する要のパーツです。適切なVAEを選ぶだけで、生成画像の品質が目に見えて変わります。

この記事では、ComfyUIでのVAE選び方を基礎から解説します。主要VAEの比較、色味やディテールへの影響、そして「画像が灰色になる」トラブルの対処法まで、実践で役立つ知識をまとめました。

体験カリキュラム

Blenderで作る
初めての建築3DCGパース

Blenderの導入から基本操作、太陽光の入る白い部屋の制作まで。全3本のカリキュラムを体験できます。

Blenderの導入から基本操作、
太陽光の入る白い部屋の制作まで。
全3本のカリキュラムを体験できます。

まずは体験カリキュラムを受講

VAE（Variational Autoencoder）とは何か

VAEの役割は、現像の工程に似ています。AIが内部で扱っているのは画像そのものではなく、ネガフィルムのような圧縮データで、それを実際に見られる画像に現像するのがVAEの仕事です。現像液や用紙の品質で写真の仕上がりが変わるのと同じように、VAEの選択で画像の色と質感が大きく変わります。

潜在空間と画像を橋渡しする役割

Stable DiffusionやFluxなどの画像生成AIは、画像そのものを直接操作していません。計算コストを抑えるため、画像を「潜在空間（Latent Space）」と呼ばれる圧縮データに変換して処理しています。

VAEは、この潜在空間と実際の画像の間を橋渡しする役割を担います。正式名称はVariational Autoencoder（変分オートエンコーダー）で、「エンコーダー」と「デコーダー」の2つのパーツで構成されるのが基本構造です。

ここで押さえておきたいのが、潜在空間のチャネル数がモデル世代ごとに違う点です。SD1.5とSDXLは4チャネル、Fluxは16チャネルで構築されており、アーキテクチャが根本的に違います（GitHub Issue #7256、2026年4月現在）。この物理構造の差こそが、世代を跨いだVAE流用ができない本当の理由です。

エンコードとデコードの仕組み

VAEの動作は2つのステップに分かれます。

エンコード（画像→潜在空間）は、入力画像を小さなデータに圧縮する処理です。img2imgワークフローで元画像を読み込むときに使われます。ComfyUIでは「VAE Encode」ノードが担当します。

デコード（潜在空間→画像）は、AIが生成した潜在データを目に見える画像へ復元する処理です。すべての画像生成ワークフローで最終段階に使われます。ComfyUIでは「VAE Decode」ノードが担います。

つまり、VAEの品質が低ければ、どれだけ優れたチェックポイントモデルを使っても最終画像の品質は落ちます。画像の「最後の仕上げ」を行うパーツ、と押さえておけば十分です。

チェックポイント内蔵VAE と外部VAE の違い

内蔵VAEと外部VAEの関係は、建物付属の標準照明と専門メーカーの照明器具の関係に似ています。標準品でもそれなりに使えますが、空間の演出にこだわるなら専用の器具に差し替えたほうが雰囲気が大きく変わります。

内蔵VAEの特徴と限界

多くのチェックポイントモデルには、VAEがあらかじめ内蔵されています。ComfyUIの「Load Checkpoint」ノードからは、MODEL・CLIP・VAEの3つの出力が得られますが、この「VAE」出力が内蔵VAEに該当します。

内蔵VAEの最大のメリットは手軽さです。追加ファイルを用意しなくても、チェックポイントを読み込むだけで画像生成ができます。

ただし、内蔵VAEが必ずしも最適とは限りません。モデル制作者がファイルサイズの都合で汎用的なVAEを組み込んでいるケースもあります。実務では、内蔵VAEの品質に不満を感じた時点で外部VAEへ切り替えるのが定番の流れです。

外部VAEを使うメリット

外部VAEを使うと、以下のような改善が期待できます。

色の鮮やかさや彩度の向上
顔のディテールや細部の描写改善
生成画像全体のシャープさの向上

とくにフォトリアル系の画像生成では、外部VAEに切り替えるだけで効果を実感する報告が多く見られます（ComfyUI Wiki: VAE Models、2026年4月現在）。内蔵VAEで「なんとなくぼやける」と感じたら、外部VAEを試す価値があります。

主要VAEの比較と選び方

VAE選びは、塗料選びと似た考え方になります。下地（チェックポイント）に合った塗料を選ばないと、仕上がりが濁ったり、最悪の場合はうまく定着しません。まずはチェックポイントの世代に合わせる、という原則から入ります。

ComfyUIでのVAE選び方は、使用するチェックポイントモデルの世代で決まります。以下に主要VAEを比較します（2026年4月現在）。

vae-ft-mse-840000（SD1.5系の定番）

対応モデル: Stable Diffusion 1.4 / 1.5系チェックポイント

vae-ft-mse-840000-ema-pruned は、Stability AI社がSD1.4〜1.5のトレーニングで使用していたVAEです。MSE（Mean Squared Error）損失関数で微調整されており、写実系で安定した結果が得られます。

SD1.5系モデルを使う場合、「特に理由がなければこのVAEでOK」と言われる定番の選択肢。フォトリアル志向のモデルとの相性が良く、色の再現性に優れています。

アニメ調モデル（Anything V3/V4など）を使う場合は、orangemix.vae や kl-f8-anime2 を合わせる運用が海外では主流です（ComfyUI VAE Showdown、2026年4月現在）。

sdxl_vae（SDXL専用）

対応モデル: Stable Diffusion XL（SDXL）系チェックポイント

sdxl_vae.safetensors は、SDXLの1024×1024ベース解像度に最適化されたVAEです。改良された知覚損失関数で学習されており、高解像度でクリーンな出力が特徴。

ただし、2026年4月現在の実運用では madebyollin/sdxl-vae-fp16-fix が標準扱いになっています。公式 sdxl_vae はfp16精度でNaN（Not a Number）を発生させる既知の問題を抱えており、fp16-fix版に差し替えることでNaN回避、VRAM削減、デコード速度約2倍が実現できます。

SDXLモデルを使う場合は sdxl-vae-fp16-fix を推奨。SD1.5用のVAEとは互換性がないため、混在させると正常に動作しません。

ae.safetensors（Flux専用）

対応モデル: Flux.1系モデル（dev / schnell / fill等）

ae.safetensors は、Black Forest Labs社のFluxモデル専用VAEです。Fluxは16チャネルの潜在空間という独自構造を持つため、4チャネルのSDシリーズVAEとは完全に別物。

Flux.1を使う場合はこのVAE一択。テキストの輪郭や建築ディテールなど、細部の再現性に優れている点がFlux VAEの強みです。配布ファイル名は ae.safetensors のままでは他VAEと紛らわしいので、flux_ae.safetensors にリネームしておくと誤選択を防げます。

モデル世代別の選び方まとめ

VAE選びで迷ったときは、次のルールが目安。

SD1.5系: vae-ft-mse-840000-ema-pruned.safetensors（アニメ系は orangemix.vae）
SDXL系: sdxl-vae-fp16-fix.safetensors（公式 sdxl_vae より推奨）
Flux系: ae.safetensors（flux_ae.safetensors にリネーム推奨）

最も大切なポイントは、チェックポイントの世代とVAEの世代を必ず合わせること。SD1.5/SDXL=4ch、Flux=16chという潜在空間の構造差が互換性の根本原因で、世代を跨ぐと画像の破綻や色崩れが起こります。

VAEが色味・ディテールに与える影響

VAEの違いは、写真の現像機種の違いに近いものです。同じネガを別の現像機で処理すると、色のノリや階調表現が変わります。VAEも同じで、同じプロンプトと同じ設定でも、選ぶVAEで仕上がりの印象がはっきり変わります。

色の鮮やかさと彩度の変化

VAEはデコード時に、潜在空間のデータをRGB画像へ変換します。この変換精度がVAEごとに違うため、同じプロンプト・同じシードでも出力画像の印象が変わります。

具体的には、外部VAE（vae-ft-mse-840000など）を使うと、チェックポイント内蔵VAEに比べて彩度が高くなる傾向があります。肌の色味が自然になり、空や植物の色もより鮮やかに再現されるケースが多くなります。

たとえば建築パースの生成では、VAEの違いが顕著に表れます。外壁の質感や照明の色温度など、微妙な色の差が仕上がりの印象を左右するためです。

顔や細部の描写品質

VAEの性能差は、顔のディテールにも影響します。目・鼻・口の形状がより鮮明になったり、髪の毛一本一本の描写が改善される場合があります。

ただし、VAEだけで劇的な品質向上を期待するのは現実的ではありません。あくまでチェックポイントモデルが生成した潜在データを「いかに正確に画像化するか」がVAEの守備範囲。モデル自体の品質が低ければ、VAEを変えても改善幅は限定的です。

VAE Decode と VAE Decode Tiled の使い分け

ComfyUIには標準の「VAE Decode」と、低VRAM向けの「VAE Decode Tiled」があります。通常のVAE Decodeは精度優先で、色味・明度を正確に再現できるのが特徴です。一方のVAE Decode Tiledは画像を分割処理することでVRAM消費を抑えますが、色・明度・コントラストが微妙にシフトする既知の挙動があり、2026年4月現在も未解消です（GitHub Issue #500）。

実務では、VRAMに余裕がある環境では通常版、VRAM不足で落ちる場合のみTiled版、という切り分けが基本。色ズレが気になる場合は、後述する色補正カスタムノードの導入も選択肢になります。

ComfyUIでのVAE Loader接続方法

VAEの差し替えは、プリンタドライバを入れ替える作業に似ています。PCに追加ドライバを入れ、印刷ダイアログでそのドライバを選ぶ、という手順と同じで、ComfyUIでもファイルを所定フォルダに置き、ノードで指定するだけで切り替えられます。

VAEファイルの配置場所

外部VAEを使うには、まずVAEファイルをComfyUIの所定フォルダに配置します。

ComfyUI/models/vae/

このフォルダに .safetensors 形式のVAEファイルを配置してください。ファイルはHugging Faceなどのモデル配布サイトからダウンロードできます。

運用のコツとして、models/vae/ 配下を sd15/, sdxl/, flux/ のサブフォルダに分けて格納する方法が推奨されています（ComfyUI Wiki: Install VAE）。ドロップダウン一覧で世代が混在すると誤選択事故が起きやすいため、最初の段階で整理しておくと安心です。

VAE Loaderノードの接続手順

ComfyUIで外部VAEを使う手順は次のとおり。

ワークフロー上で右クリックし、「Add Node」から「Load VAE」ノードを追加します
Load VAEノードのドロップダウンから、使いたいVAEファイルを選択します
Load VAEノードの「VAE」出力を、「VAE Decode」ノードの「vae」入力に接続します
「Load Checkpoint」ノードからのVAE出力は接続せず、Load VAEからの出力だけを使います

この設定により、チェックポイント内蔵VAEの代わりに外部VAEが使われるようになります。ノード接続の基礎から押さえたい方はComfyUIのノードとは？初心者が最初に知る考え方で整理しています。

生成画像が灰色・ぼやける場合のトラブルシュート

画像トラブルの原因は、建築現場で言えば配線ミスや接続ミスが大半を占めるのと似ています。原因のパターンは決まっているので、チェックリスト的に潰していけば短時間で解決することが多い領域です。

VAE未設定・ミスマッチが原因のケース

生成画像が灰色一色になる、極端にぼやける、紫がかる、白飛びする。こうした症状の原因は、海外の事例集計で約99%がVAEミスマッチとされています（Angry Shark Studio: 10 ComfyUI Mistakes、2026年4月現在）。まずは以下を確認してください。

VAEが接続されていない: VAE Decodeノードに有効なVAE出力が接続されていないと、潜在データを正しく画像に変換できません。Load CheckpointまたはLoad VAEからのVAE出力が確実に接続されているか確認しましょう。

世代のミスマッチ: SD1.5用のVAEをSDXLモデルに接続するなど、世代違いの組み合わせが画像破綻の典型原因。チェックポイントの種類に合ったVAEを選んでください。

VAEファイルの破損: ダウンロードが不完全だったり、ファイルが壊れていると灰色画像になります。再ダウンロードで解決するケースが多いです。

VRAM不足・精度設定が原因のケース

VAE設定に問題がないのに画像がぼやける場合、ハードウェアの制約が原因かもしれません。

VRAM（ビデオメモリ）が不足すると、ComfyUIはVAEの計算精度を自動的に下げます。FP32からFP16への精度低下により、微妙な色情報が失われてぼやけた印象になります。

対処法としては、ComfyUIの起動オプションに --force-fp32-vae を追加する方法があります。ただし、VRAM消費量が増えるため、8GB以上のGPUメモリが推奨です。

実務では、VRAM 8GBのGPUでSD1.5系を使う場合、VAEのFP32実行が安定動作のボーダーラインとされる傾向があります。SDXLやFluxではより多くのVRAMが必要です。

色ズレ補正カスタムノードという選択肢

Tiled版の色シフトや、特定モデル組み合わせで発生する微妙な色ズレには、海外で普及している補正用カスタムノードが有効です。代表例として VAE Decode ColorFix や EasyColorCorrector（VAEColorCorrector）があり、ComfyUI Managerから導入できます（2026年4月現在）。

通常のVAE切り替えで解決しない色問題に直面したときの最終手段として覚えておくと便利です。

まとめ

ComfyUIでのVAE選び方は、チェックポイントモデルの世代に合わせるのが基本です。SD1.5系なら vae-ft-mse-840000、SDXL系なら sdxl-vae-fp16-fix、Flux系なら ae.safetensors を選べば大きく外しません。

VAEは画像生成の「最後の仕上げ」を担うパーツです。色味の鮮やかさやディテールの鮮明さに影響するため、チェックポイント選びと同じくらい大切な要素になります。生成画像の品質に違和感を覚えたら、VAEの設定を見直してみてください。

モデル選びの全体像を押さえたい方は、ComfyUI モデル完全ガイドで各モデルの種類と役割を確認できます。チェックポイントモデルの選び方はチェックポイントモデルの違い｜SD1.5・SDXL・SD3の選び方で詳しく紹介しています。

この記事を書いた人

橘美咲 PERSC 専任講師

「CADは裏切らない。昨日引けなかった線が、今日は引ける。それが楽しいの」

元・完全未経験の文系女子。新卒で入った建築現場で「図面が読めない」と絶望し、悔し涙を流しながらCADを独学で習得した過去を持つ。その後、設計事務所、ゼネコンを経てフリーランスへ転身。現在はPERSCにて「現場で本当に使える技術」を伝授する鬼（？）コーチとして活動中。「線一本にも意味がある」が口癖。趣味は、完成した建物を見上げながらのビールと、深夜の猫動画巡回。

この著者の記事一覧へ

VAEの役割と選び方｜色味・ディテールへの影響

Blenderで作る
初めての建築3DCGパース