AI建築パースのプロンプトの考え方|言葉よりラフレンダリングが重要な理由
AI建築パースで画像生成AIを使うとき、まず「プロンプトの書き方」を調べる方は多いのではないでしょうか。
しかし実務では、プロンプトの言い回しを何十回も調整するよりも、3DCGのラフレンダリングを1回しっかり作った方が、最終品質は確実に高くなります。
この記事では、AI建築パースにおけるプロンプトの考え方として、制御できる範囲と限界を整理したうえで、「言葉よりもラフレンダリングが重要」というPERSC JOURNALの視点を解説します。
ネガティブプロンプトやSeed値固定といった実践テクニック、ControlNet・Image to Image・LoRAとの使い分けの判断軸もあわせて紹介しています。
AI建築パースでプロンプトはどこまで効くのか
プロンプトで制御できるのは「建物種別・スタイル・素材・光・構図・ムード」の6要素までで、寸法精度や空間の整合性はプロンプトの守備範囲外です。プロンプトは画像制御手段の「ひとつ」に過ぎないという認識が出発点になります。
プロンプトで指示できること
プロンプトで制御できる範囲は、大きく6つの要素に分かれます。
まず「何を作るか」を決める3要素です。
- 建物の種類・用途(住宅、オフィスビル、商業施設など)
- 建築スタイル(モダン、北欧、和風、ブルータリズムなど)
- 素材の方向性(コンクリート打放し、木造、ガラス張りなど)
この3つで建物の基本像を言葉で指定できます。
次に「どう見せるか」を決める3要素があります。
- 光環境(昼光・夕景・夜景・曇天)
- 視点アングル(鳥瞰・人目線・内観・外観)
- 雰囲気やムード(温かい・クール・ミニマル)
この3つで画像のトーンや構図をコントロールできます。
ただし、これら6要素がプロンプトで制御可能な範囲のほぼ全体像です。これを超える細部、たとえば窓の数や寸法の正確さは、プロンプトだけでは制御しきれません。
なお、Midjourney・Stable Diffusionでは英語でプロンプトを書くことが推奨されています。DALL·E 3やGPT-4oの画像生成機能は日本語にも対応していますが、建築用語の語彙は英語の方が圧倒的に豊富です。意図通りの結果を得やすいという点で、英語プロンプトを基本にするとよいでしょう。
プロンプトでは制御しきれないこと
一方で、プロンプトだけでは難しい領域も明確に存在します。
寸法の正確さは、プロンプトで制御できない最たる例です。窓の縦横比や階高のプロポーションを「高さ3mの天井」と書いても、AIはそれを正確に反映してくれません。窓やドアの数・配置・形状の一貫性も同様で、生成するたびに結果が変わります。
特定の建材の正確な質感も困難な領域です。特注タイルの模様や特定メーカーの建材を、テキスト指示だけで正確に伝えることには限界があります。
さらに、建物と敷地の関係や室内のスケール感といった空間的整合性もプロンプトの守備範囲外です。つまりプロンプトは「ざっくりとした高品質」は実現できますが、「細部の正確さ」には別の手段が必要になります。
プロンプトは「制御手段のひとつ」に過ぎない
ここで押さえておきたいのは、プロンプトが画像生成AIを制御する手段の「ひとつ」でしかないという点です。
プロンプト以外にも複数の制御手段があります。ラフレンダリング画像を使うImage to Image、構造線で形状を保護するControlNet、スタイルを学習させるLoRA、部分修正を行うInpaintingなどです。
さらにIP-Adapter(参照画像からスタイルを抽出して新しい生成に反映する技術)のように、新しい手段も登場し続けています。プロンプトだけに頼ると、構図も寸法もAI任せの「AIガチャ」状態に陥りやすくなるでしょう。
制御手段の全体像を把握したうえで、「プロンプトには何を任せ、何は別の手段で制御するか」を判断できるようになること。これが本記事で伝えたい「プロンプトの考え方」の核心です。
建築パース用プロンプトの基本構成
プロンプトは「全体像から詳細へ」の順で組み立て、「Subject→Style→Material→Lighting→Camera→Mood→Quality Booster」のテンプレート構造がベースになります。建築家スタイルの指定やウェイト構文を使えば、方向性をさらに効率よく固められます。
「全体像から詳細へ」の書き順
画像生成AIは、プロンプトの前方にあるキーワードほど強く反映する傾向があります。したがって、書き順は「全体像から詳細へ」が原則です。
具体的には、「何を作るのか(建物種別+用途)」を先頭に置きます。続けてスタイル・素材感・光環境・構図・雰囲気の順で記述していく流れです。先頭で全体像を固め、後半で詳細を補うイメージです。
先頭から細部を盛り込むと全体像がブレるため、まず大枠を確認してから細部を追加しましょう。
海外の建築ビジュアルコミュニティでは、プロンプトのテンプレート構造が定番化しています。「Subject(建物)、Style、Material、Lighting、Camera、Mood、Quality Booster」という順番です。
末尾に置くQuality Boosterとは、「8k, photorealistic, architectural photography, ultra detailed」といった品質向上キーワードのことで、これを付加すると生成画像の全体的なクオリティが底上げされます。
PERSC JOURNALでも、このテンプレート構造をベースにプロンプトを組み立てることを推奨しています。
6つの構成要素とその効果
前述の6要素を、もう少し掘り下げて整理しましょう。
| 要素 | 英語での指定例 | 生成結果への影響 |
|---|---|---|
| 建物種別 | residential house / office tower / museum | 建物の基本形状を決定 |
| 建築スタイル | minimalist / brutalist / Scandinavian | 全体の方向性を一気に固める |
| 素材・マテリアル | exposed concrete / timber / glass curtain wall | 外観の質感・色調に影響 |
| 光環境 | golden hour / overcast sky / interior warm light | 画像全体の色味と雰囲気を左右 |
| 視点・構図 | eye-level / aerial view / interior wide angle | アングルとパースペクティブを決定 |
| 雰囲気・ムード | serene / dramatic / cozy | 写真的なトーンを微調整 |
要素の追加による変化を確認してみてください。
- 要素が少ない場合:
modern minimalist house - 要素を追加した場合:
modern minimalist house, warm evening light, eye-level perspective
後者では光の質感・視点の安定性・画面の情報量が大きく変わります。各要素を意識的に追加・削除することで、生成結果のどの部分が変化するかを把握できるようになるでしょう。
さらに踏み込んだ制御として、ウェイト(重み付け)構文があります。Stable Diffusionでは (keyword:1.5) のように数値で重要度を指定でき、Midjourneyでは keyword::2 という構文で同様の制御が可能です。建築パースでは素材感やライティングを強調したいケースが多く、特定要素の影響度を細かくコントロールしたい場面で役立ちます。
レンダリングエンジン名の指定も、建築パース制作者にとっては直感的なテクニックです。「V-Ray render」「Octane render」「Corona render」などをプロンプトに含めると、馴染みのあるレンダリング品質に近い質感が得られます。普段使っているレンダラーの名前でAIに指示を出せる点は、建築パース制作者ならではの利点です。
アスペクト比の指定も構図に影響を与えます。横長(16:9)はランドスケープや低層建築の外観に向いており、縦長(9:16)はタワー型建築のダイナミックな構図を引き出しやすくなります。正方形(1:1)はディテール寄りの構図が得やすい傾向です。
建築家スタイルの指定が方向性を一気に固める
プロンプトで有効なテクニックの一つに、建築家の名前を使った方向性の指定があります。
「in the style of Tadao Ando」と指定すれば、コンクリート打放しと光の演出が特徴的な画風が生成されます。「inspired by Zaha Hadid」なら、曲線的で流動的なフォルムが強調されるでしょう。ほかにも以下のような傾向が得られます。
- Norman Foster: ハイテクなガラスとスチールの構造
- Kengo Kuma: 木材や自然素材を活かした環境との融合
- Bjarke Ingels(BIG): 大胆な幾何学的造形
このテクニックが効果的な理由は、建築家の名前が「素材・構図・光・ムード」の複数要素を一括で指定するショートカットとして機能するためです。個別要素を細かく指定するよりも効率よくテイストを固められます。
ただし、あくまで「テイストの方向性を伝える手段」として使うべきです。特定の建築家の作品を再現する目的での使用は、著作権の観点からも避けてください。
なお、Midjourney・Stable Diffusion・DALL·E 3ではツールごとにプロンプトの効き方が異なります。FLUX.2はT5テキストエンコーダーにより長文プロンプトの理解に強く、GPT-4oは会話形式で段階的に画像を修正できます。このようにツールの進化で、プロンプトの扱い方自体が変わりつつある状況です。各ツールの具体的なプロンプト実践については、「Midjourney・Stable Diffusionで建築パースを作る方法完全ガイド」で詳しく解説しています。
言葉よりラフレンダリングが重要な理由
同じプロンプトでも、3DCGのラフレンダリングがあれば構図と形状が安定し、AIは質感表現に集中できます。プロンプトの言い回しを30分調整するより、その30分でラフレンダリングのライティングを整えた方が、最終品質への効果ははるかに大きいというのが実務上の結論です。
ラフレンダリングがあるとないとで何が変わるか
同じプロンプトを使っても、ラフレンダリングの有無で生成結果は大きく変わります。
ラフレンダリングなし(テキストのみ)の場合、AIが構図・寸法・ライティングをすべて独自に解釈します。同一プロンプトで4回生成すると、4通りの構図・プロポーションが出てきます。建物の高さ、窓の数、屋根の形状まで毎回異なるのが実情です。
ラフレンダリングあり(3DCGレンダリング+同じプロンプト)の場合はどうでしょうか。構図・寸法がImage to ImageやControlNetによって固定されるため、4回生成しても構図と形状は安定します。変化するのはテイストや質感のバリエーションだけです。AIが質感・雰囲気の表現に集中できるため、プロンプトの指示もより正確に反映されます。
つまり、ラフレンダリングは「AIに任せる範囲」と「自分で確定させる範囲」の線引きをする役割を担っています。プロンプトの良し悪しよりも、ラフレンダリングの有無の方が最終品質への影響は大きいといえます。
プロンプトは「方向性の微調整」に使うもの
ラフレンダリングで構図・寸法・ライティングを確定させたうえで、プロンプトの役割を「方向性の微調整」に限定すること。PERSC JOURNALではこの考え方を推奨しています。
たとえば、3DCGで作成した住宅外観パースのラフレンダリングをImage to Imageに渡す場合を考えてみましょう。構図やプロポーションはラフレンダリングで確定しているため、プロンプトで指定するのは「warm evening light, lush green garden, photorealistic」のような雰囲気と質感の方向性だけで十分です。
「プロンプトで全部やろうとする」発想から、「ラフレンダリングで8割を決めてプロンプトで残り2割を調整する」発想への切り替えが重要です。プロンプトに求める役割を絞ると、プロンプト設計自体もシンプルになります。
Verasのような建築特化AIツールでも、この考え方が実装レベルで採用されています。Verasの「Geometry Slider」は、プロンプトの創造性とジオメトリの忠実度のバランスを調整する機能です。スライダーを上げるとプロンプト優位に、下げるとジオメトリ優位になります。「プロンプトとラフレンダリングのどちらを優先するか」を明示的に制御できる仕組みであり、PERSC JOURNALの考え方である「ラフレンダリングが先」という考え方と方向性が一致しています。
「ラフレンダリングづくりに時間をかける方が近道」という実務的結論
プロンプトの言い回しを30分かけて調整するなら、その30分でラフレンダリングのライティングやアングルを調整した方が、最終品質への効果は大きくなります。
プロンプトの調整は「AIガチャ」になりやすい性質があります。同じプロンプトでも毎回異なる結果が出るため、「たまたま良い結果が出た」ことに依存しがちです。一方、ラフレンダリングの品質を上げると、その改善は毎回の生成に安定して反映されます。
3DCG制作者であれば、BlenderやSketchUpでのラフレンダリング作成は得意分野のはずです。プロンプトの試行錯誤に時間を費やすよりも、自分の強みである3DCGスキルを活かす方が、はるかに効率的ではないでしょうか。
プロンプト以外の制御手段を知っておく
構図はControlNet、質感はI2I、テイスト統一はLoRA/IP-Adapter、部分修正はInpainting——プロンプトだけに頼らず、制御対象に応じて手段を使い分けることが、AI建築パースの品質と効率を決めます。
ControlNetで形を保つ
ControlNetは、ラフレンダリング画像から構造線(エッジ・深度マップ)を抽出し、形状を維持したまま画風だけを変える技術です。
建築パースで寸法の正確さを担保するには、ControlNetの併用がほぼ必須といえます。プロンプトでは制御できない「窓の配置」や「階高のプロポーション」を、ControlNetが構造情報として保持してくれるためです。
Canny(エッジ抽出)やDepth(深度マップ)といったプリプロセッサの選択で、保持する情報の種類を変えられます。詳しい仕組みと使い方は、「ControlNetとは?建築AIで形を崩しにくくする基本」で解説しています。
Image to Imageで雰囲気を変える
Image to Imageは、ラフレンダリング画像全体をベースにAIで質感・雰囲気を変換する手法です。
Denoising Strengthの値で変換の強さを調整できます。値を低く設定すれば元画像に近い結果が、高く設定すれば大胆な変換が得られます。この手法ではプロンプトの役割は「どの方向に変えるか」の指示に限定されるため、構図や形状はラフレンダリングが担保してくれます。
詳しくは「Image to Imageとは?建築パースの雰囲気調整で使う基本」で解説しています。
LoRAでテイストを揃える
LoRA(Low-Rank Adaptation)は、特定のスタイルや質感をモデルに追加学習させる手法です。
プロンプトでは表現しきれない一貫したテイストを維持したい場合に有効です。たとえば、シリーズもののパース制作で「全カットのトーンを揃えたい」という要件があるとき、LoRAを適用すれば毎回のプロンプトでテイストを書き足す必要がなくなります。
詳しくは「LoRAとは?建築ビジュアルでテイストを揃えるための考え方」で解説しています。
制御手段の使い分けマトリクス
「何を制御したいか」に応じて、使うべき手段は変わります。
| 制御したい対象 | 最適な手段 | プロンプトの役割 |
|---|---|---|
| 構図・形状 | ControlNet | 補助的(構図の指定に使う程度) |
| 質感・雰囲気 | プロンプト+Image to Image | 主導的(方向性を言語で指示) |
| テイストの一貫性 | LoRA / IP-Adapter | 不要(LoRA)/ 参照画像で指定(IP-Adapter) |
| 部分的な修正 | Inpainting | 局所的(修正箇所のみに指示) |
IP-Adapterは、参照画像からスタイルを抽出して新しい生成に反映する技術です。LoRAと異なり事前の学習が不要で、参照画像を変えるだけでテイストを切り替えられます。プロジェクト途中でスタイルの方向転換が必要になった場合にも柔軟に対応できるでしょう。
Inpaintingは画像の特定領域だけを再生成する技術です。建築パースでは、窓回りのディテール修正や植栽の差し替えなど、部分的な手直しに使います。プロンプトで全体を再生成する必要がなく、問題箇所だけを修正できる点がメリットです。
このマトリクスを持っておくと、プロンプトに過度な期待をかけなくなります。すべてをプロンプトで解決しようとする発想が非効率の原因であり、手段の使い分けがAI建築パースの品質と効率を決めるといえます。
実践的なプロンプト調整のプロセス
プロンプト調整は「最初はシンプルに3要素だけ、変更は1回1要素」が鉄則です。Seed値固定とネガティブプロンプトを併用し、構図が安定しなければControlNetに切り替えるのが効率的な進め方です。
最初はシンプルに、要素を絞って方向性を確認する
いきなり詳細なプロンプトを書くのは避けましょう。まず「建物種別+スタイル+光環境」の3要素だけで生成し、大まかな方向性を確認します。
たとえば「modern residential house, natural daylight, exterior」程度のシンプルなプロンプトから始めてみてください。方向性が合っていれば、素材(exposed concrete, large glass windows)や構図(eye-level, slight low angle)を段階的に追加していきます。
最初から6要素すべてを盛り込むと、「どの指定がどう効いたか」が分からなくなります。大枠を確認してから細部を追加する方が、結果のコントロール精度は高まります。
1回の変更は1要素だけ、効果を検証する
プロンプトを調整するとき、一度に複数の要素を変えるのは避けてください。「光環境を変える」と同時に「素材も変える」と、どちらの変更が結果にどう影響したか判断できなくなります。
1回の調整で変えるのは1要素だけにしましょう。「光環境だけ夕景に変えてみる」「素材だけコンクリートからレンガに変えてみる」といった具合です。この繰り返しで、各要素が生成結果にどう影響するかの感覚が蓄積されていきます。
この「1回1要素」のルールをさらに厳密にするには、Seed値の固定が有効です。Seed値とは画像生成時に使われる乱数のシードで、同一Seedを指定すればランダム性を排除できます。Seed値を固定した状態でプロンプトの1要素だけを変更すれば、その要素が生成結果に与える影響を正確に分離して検証できるでしょう。プロンプト調整を感覚ではなく検証に基づいて進めるための基本的なアプローチです。
ネガティブプロンプトで不要な要素を排除する
プロンプトの調整には「何を足すか」だけでなく、「何を引くか」の発想も欠かせません。
ネガティブプロンプトとは、生成画像に含めたくない要素を指定する仕組みです。Stable Diffusionでは標準機能として搭載されており、Midjourneyでは --no パラメータが同様の機能を提供しています。
建築パースでは「blurry, distorted, unrealistic proportions, floating objects, watermark, text, low quality」などが定番のネガティブプロンプトです。これらを指定しておくことで、ぼやけた描写や不自然なプロポーション、透かし文字の混入といった品質上の問題を抑制できます。
通常のプロンプト(ポジティブプロンプト)で方向性を定め、ネガティブプロンプトで品質の下限を底上げするという使い分けが基本です。ただし、ラフレンダリングありのワークフローでは構図や形状の問題はラフレンダリング側で解決済みです。そのためネガティブプロンプトの役割は、質感の乱れや不要なオブジェクトの抑制に限定されます。
プロンプトの限界を感じたらControlNetに切り替える
何度かプロンプトで再生成しても構図や形状が安定しない。そんな状況に陥ったら、それはプロンプトの問題ではありません。
「プロンプトの言い回しが悪い」のではなく「プロンプトの守備範囲外の問題に取り組んでいる」と判断できるかどうか。この見極めこそが、無駄な試行錯誤を減らす鍵になります。
プロンプトでの再生成を繰り返しても構図が安定しない場合は、ラフレンダリングの作成やControlNetの導入を検討してみてください。建築パース制作者であれば、3DCGのラフレンダリングを用意するスキルはすでに持っているはずです。プロンプトの限界を感じたら、迷わず別の制御手段に切り替えましょう。
まとめ
本記事の内容を5つのポイントに集約します。
- プロンプトは「建物種別・スタイル・素材・光・構図・ムード」の6要素で組み立て、「全体像から詳細へ」の順で書きます
- ウェイト構文やQuality Boosterを活用しつつも、プロンプトだけでは寸法の正確さや空間の整合性を制御しきれないことを認識しておきましょう
- 言葉(プロンプト)の調整で品質を上げるよりも、3DCGのラフレンダリングの品質を上げる方が近道です
- プロンプトは「方向性の微調整」と位置づけ、構図はControlNet、テイストはLoRAやIP-Adapter、修正はInpaintingと使い分けてください
- ネガティブプロンプトやSeed値固定も活用し、「最初はシンプルに、1回1要素」のルールで効率的に調整を進めましょう
プロンプト設計に時間をかけるよりも、まずラフレンダリングの品質を上げることが最短ルートです。建築パース制作者の3DCGスキルは、AI活用においても最大の武器になります。
さらに理解を深めるには、以下の関連記事も参考にしてみてください。
- 建築パースで画像生成AIを使う流れ|参考画像・ラフレンダリング・仕上げの順番: プロンプトがワークフロー全体のどこに位置するかを整理しています
- ControlNetとは?建築AIで形を崩しにくくする基本: プロンプトでは制御できない形状の保護手段を解説しています
- LoRAとは?建築ビジュアルでテイストを揃えるための考え方: プロンプトを使わずにスタイルを統一する手法を紹介しています
- Midjourney・Stable Diffusionで建築パースを作る方法完全ガイド: ツール別の具体的なプロンプト実践を解説しています
- 3DCG→AI補助ワークフロー|建築ビジュアル制作で失敗しない判断軸と全体像: 本記事の上位テーマであるAI補助ワークフローの全体像を俯瞰できます


