【ComfyUI学習帳】第6回　描きたいポーズを外さない！ComfyUIで始める『img2img』超入門：元絵を活かしてクオリティを爆上げするコツ

img2imgを使う最大のメリットとは？

AIイラストには、呪文（プロンプト）だけで描く方法以外に、「画像をもとに描く（img2img）」という強力な手法があります。これを使うと、こんな悩みが解決します。

まずは、手動でプロンプトを入力する基本の形を作ります。

完成図

使用ノードはこれまでに学習したノードを使いますが１つだけ新しいノードがあります。
「VAEエンコーダー」です。「VAEデコーダー」と似ているので間違えないように注意してください。

「Kサンプラー」の「ノイズ除去」で元画像から変更具合を設定します。

0.1〜0.3：元絵をほぼ変えずに、線や塗りを綺麗にする「清書モード」。
0.4〜0.6：元絵の良さを残しつつ、AIに新しい要素を描かせる「進化モード」。

このあたりは自分で数値を変えて色々試してみてください。

「進化モード」の場合、プロンプト欄は元画像から変化させたい内容のプロンプトを入力してください。

「清書モード」の場合は入力しなくても大丈夫です。（「ノイズ除去」の値が小さい場合）

「元の画像に何が描かれているか、単語を調べるのが面倒」という悩みを解決するのが、AIによる画像解析ノード 「WD14 Tagger」 です。これを使えば、画像を読み込むだけでAIが自動的にプロンプトを作成してくれます。

まずは、ComfyUI Managerを使ってノードを導入しましょう。

「WD14 Tagger」は便利ですがあくまでAIが自動で取り出してくるものなので、どうしても足りないものがあったり、新規に追加したい要素がある場合に自分でも手打ちでプロンプトを打ち込めるようにします。

自分で打ち込むプロンプトとWD14で自動抽出したプロンプトを合わせるのが「連結」ノードです。

「連結」ノードは画面をダブルクリックして「連結」と検索すると出てきます。

「WD14 Tagger」ノードと「連結」ノードを先ほど作ったimg2imgのワークフローに追加して以下のように接続します。

1.「WD14 Tagger」の入力「Image」は「画像を読み込む」ノードの画像と繋げます

2.「WD14 Tagger」ノードの出力である「文字列」は「連結」ノードの「string_b」に接続します。
上のstring_aには手動で入れたいプロンプトを入力します。

3.「連結」ノードの出力「文字列」を「CLIPテキストエンコード（プロンプト）」ノード（ポジティブプロンプト側）の「text」に接続します。
パッと見、CLIPテキストエンコードのノード入力は「クリップ」しかありませんが、伸ばした線をプロンプト入力欄に持っていけば接続できます。

「Show Text」ノードは連結したプロンプトを表示するだけなので、あってもなくても構いません。
マネージャーで「comfyui-custom-scripts」をインストールすれば使用できます。

なぜ「Show Text」ノードを追加したのかと言うと、「CLIPテキストエンコード（プロンプト）」ノードに連結したプロンプトが表示されないからです。しかし、処理は行われています。ただ表示されないだけなのです。なので私は確認のために「Show Text」ノードを追加しました。

🛠️ WD14 Tagger 設定項目ガイド

項目名	役割（ざっくり言うと）	調整のアドバイス
model	AIの「視力」の種類	基本はそのままでOK。モデルを変えると、タグの細かさや傾向が変わります。
threshold	AIの「自信」の基準値	一番重要です。数字を下げると「たぶんこれもある」とタグが増え、上げると「絶対これだ」という確実なものだけに絞られます。
character_threshold	キャラクター名の厳しき	特定のアニメキャラなどを特定する際の基準値です。誤判定を防ぐため、通常は高め（0.85前後）にします。
replace_underscore	アンダースコアを消す	`long_hair` を `long hair` に変換します。人間が読みやすくなりますが、AI的にはどちらでも通じます。
trailing_comma	最後にコンマを付ける	プロンプトの最後に `,` を付けます。この後に自分で言葉を足したい時に便利です。
exclude_tags	出してほしくない言葉	毎回出てくるけど不要なタグ（例：`simple background` など）があれば、ここに打ち込むと除外してくれます。