【ComfyUI学習帳】第6回 描きたいポーズを外さない!ComfyUIで始める『img2img』超入門:元絵を活かしてクオリティを爆上げするコツ

img2imgを使う最大のメリットとは?

AIイラストには、呪文(プロンプト)だけで描く方法以外に、「画像をもとに描く(img2img)」という強力な手法があります。これを使うと、こんな悩みが解決します。

  • ポーズや構図を「言葉」で説明しなくていい:フィギュアスケートの難しいポーズや、手の位置なども一瞬で固定できます。
  • 低画質な絵を「清書」できる:昔描いた絵や、少しぼやけた画像を最新モデルでクッキリ鮮やかに。
  • キャラクターを維持したまま着せ替え:顔や体型をキープしつつ、背景や服装だけを変えたバリエーションが作れます。

基本の「img2img」ワークフローを組もう

まずは、手動でプロンプトを入力する基本の形を作ります。

完成図

使用ノードはこれまでに学習したノードを使いますが1つだけ新しいノードがあります。
「VAEエンコーダー」です。「VAEデコーダー」と似ているので間違えないように注意してください。

「Kサンプラー」の「ノイズ除去」で元画像から変更具合を設定します。

0.1〜0.3:元絵をほぼ変えずに、線や塗りを綺麗にする「清書モード」。
0.4〜0.6:元絵の良さを残しつつ、AIに新しい要素を描かせる「進化モード」。

このあたりは自分で数値を変えて色々試してみてください。

「進化モード」の場合、プロンプト欄は元画像から変化させたい内容のプロンプトを入力してください。

「清書モード」の場合は入力しなくても大丈夫です。(「ノイズ除去」の値が小さい場合)

【さらに便利に!】WD14 Taggerでプロンプトを自動化

「元の画像に何が描かれているか、単語を調べるのが面倒」という悩みを解決するのが、AIによる画像解析ノード 「WD14 Tagger」 です。これを使えば、画像を読み込むだけでAIが自動的にプロンプトを作成してくれます。

WD14 Taggerのインストール方法

まずは、ComfyUI Managerを使ってノードを導入しましょう。

  1. ComfyUIのメニューから 「Manager」 を開きます。
  2. 「Custom Nodes Manager」 をクリックします。
  3. 検索窓に WD14 と入力します。
  4. ComfyUI-WD14-Tagger を探して 「Install」 ボタンを押します。
  5. インストールが終わったら、ComfyUIを 再起動 してください。

「連結」ノードを使う

「WD14 Tagger」は便利ですがあくまでAIが自動で取り出してくるものなので、どうしても足りないものがあったり、新規に追加したい要素がある場合に自分でも手打ちでプロンプトを打ち込めるようにします。

自分で打ち込むプロンプトとWD14で自動抽出したプロンプトを合わせるのが「連結」ノードです。

「連結」ノードは画面をダブルクリックして「連結」と検索すると出てきます。

接続手順

「WD14 Tagger」ノードと「連結」ノードを先ほど作ったimg2imgのワークフローに追加して以下のように接続します。

1.「WD14 Tagger」の入力「Image」は「画像を読み込む」ノードの画像と繋げます

2.「WD14 Tagger」ノードの出力である「文字列」は「連結」ノードの「string_b」に接続します。
上のstring_aには手動で入れたいプロンプトを入力します。

3.「連結」ノードの出力「文字列」を「CLIPテキストエンコード(プロンプト)」ノード(ポジティブプロンプト側)の「text」に接続します。
パッと見、CLIPテキストエンコードのノード入力は「クリップ」しかありませんが、伸ばした線をプロンプト入力欄に持っていけば接続できます。

「Show Text」ノードは連結したプロンプトを表示するだけなので、あってもなくても構いません。
マネージャーで「comfyui-custom-scripts」をインストールすれば使用できます。

なぜ「Show Text」ノードを追加したのかと言うと、「CLIPテキストエンコード(プロンプト)」ノードに連結したプロンプトが表示されないからです。しかし、処理は行われています。ただ表示されないだけなのです。なので私は確認のために「Show Text」ノードを追加しました。

WD14 Taggerの設定

🛠️ WD14 Tagger 設定項目ガイド

項目名役割(ざっくり言うと)調整のアドバイス
modelAIの「視力」の種類基本はそのままでOK。モデルを変えると、タグの細かさや傾向が変わります。
thresholdAIの「自信」の基準値一番重要です。 数字を下げると「たぶんこれもある」とタグが増え、上げると「絶対これだ」という確実なものだけに絞られます。
character_thresholdキャラクター名の厳しき特定のアニメキャラなどを特定する際の基準値です。誤判定を防ぐため、通常は高め(0.85前後)にします。
replace_underscoreアンダースコアを消すlong_hairlong hair に変換します。人間が読みやすくなりますが、AI的にはどちらでも通じます。
trailing_comma最後にコンマを付けるプロンプトの最後に , を付けます。この後に自分で言葉を足したい時に便利です。
exclude_tags出してほしくない言葉毎回出てくるけど不要なタグ(例:simple background など)があれば、ここに打ち込むと除外してくれます。

基本的に設定する値はthresholdの項目だけで良さそうです。

完成ワークフロー

注意事項:画像を大きく変えたい場合、WD14 Taggerの抽出したプロンプトが邪魔になってしまう場合があります。
対処法としては、2種類のワークフローを作る(WD14 Taggerありとなし)もしくは一時的に「連結」ノードとCLIPテキストエンコーダーのラインを削除する方法。

まとめ:img2imgは「理想への近道」

プロンプトだけで理想の1枚を出すのはガチャのようなもの。でも、img2imgなら「自分の持っているイメージ(元絵)」からスタートできるので、圧倒的に効率よく理想の絵にたどり着けます。

AIイラスト制作には大容量ストレージが必須です

ComfyUIやStable Diffusionを使っていると、

✅ モデル(Checkpoint / LoRA / ControlNet)
✅ 生成した画像や動画
✅ 学習データやバックアップ

などで、あっという間に数百GB〜数TBの容量を使います。

特にCドライブ(SSD)にすべて保存していると、 Windowsの動作が不安定になったり、生成エラーの原因になることもあります。

そのためおすすめなのが、モデルや生成画像は大容量HDDに保存して、CドライブはComfyUI本体だけにする構成です。

実際に多くのAIイラストユーザーが「SSD+大容量HDDの併用」で環境を安定させています。

✅ AIイラスト用途で選ぶポイント
容量:最低 4TB以上(できれば8TB)
信頼性の高いメーカー(Seagate / Western Digital / Toshiba)
長時間稼働向けモデル

以下は、AIイラスト制作用ストレージとして実績のあるおすすめ商品です。

Western Digital Blue 4TB(内蔵HDD)

・安定性が高く故障報告が少ない
・価格と信頼性のバランスが良い
・AIモデル保存用に最適
Western Digital Blue 4TB
Amazonで購入する


Seagate IronWolf 8TB

✅私はこれを購入しました。
・NAS向け設計で長時間稼働に強い
・大量のAIモデル・生成データを安心して保存できる
・将来的に動画生成や学習用途にも対応
Seagate IronWolf 8TB
Amazonで購入する


私の使用しているグラフィックボード

GeForce RTX 5060 Ti

現在使用しているグラボです。
グラフィックRAMサイズは16GBです。
今まで使っていたSabilityMatrixが使えなくなったりComfyUIも動かすにはひと手間必要だったので、正直そこまでお勧めはしません。
しかし今後のアップデートなどで使用環境が良くなることを期待しています。スペックは以前のグラボより高いです
GeForce RTX 3060 Ti

商品リンク: https://amzn.to/4aoafIJ

GeForce RTX 3060 Ti

これは以前まで使っていたグラボです。
グラフィックRAMサイズは8GBと少し物足りないですが、ローカル生成AIツールでは安定して使えます。
stable-diffusion-webui-forgeを使えば960×1680サイズもそこそこのスピードで生成してくれます!
GeForce RTX 3060 Ti

商品リンク: https://amzn.to/4q6dnO7
AIイラスト
Celestiaをフォローする
セレスティアのAIゆるラボ|AIイラスト・AI動画・マネタイズ実験室

コメント

タイトルとURLをコピーしました