【ComfyUI】Wan2.2で1枚絵を喋らせる！歌わせる！リップシンクのワークフローを使ってみた

今回は、ComfyUIに標準で用意されているテンプレートワークフロー（video_wan2_2_14B_s2v）を使って、「1枚のイラストと音声ファイルからリップシンク動画を作る」という実験を行いました。

まずは基本：挨拶動画を作ってみる
歌わせてみる
検証：イントロのある曲で試す
課題：音声とBGMの分離が必要
救世主：音源分離ワークフロー
解決：ワークフローの合体
まとめ

まずは基本：挨拶動画を作ってみる

手始めに、以下の素材でシンプルな動画を作ってみました。

画像: 生成したキャラクターのイラスト1枚
音声: 「今日も一日お疲れ様なのじゃ」という短いセリフの音声ファイル

結果： 音声と口の動きが合っています。これは非常にうまくいきました。
「日々の挨拶動画」くらいならすぐに量産できそうです。

音声とイラストからリップシンクする動画を作ったのじゃ💖

ComfyUIのテンプレートにあるvideo_wan2_2_14B_s2vというワークフローなのじゃ

生成時間の設定がわからず、後半は口をパクパクさせているがこれはわしのミスなのじゃ🥴

ローカル生成でここまで出来るとは！ pic.twitter.com/rUBV0lk2wx
— セレスティア💖学園長 (@owata_aiart) February 16, 2026

ここで気になったことは動画の長さです。
何も考えずにとりあえず生成した見たのですが、生成された動画の長さが14.4375秒でした。
これがデフォルト値みたいです。

問題はこれが設定値をかえるだけで長くしたり短くしたり出来ない事です（多少は出来る）

図の「VideoS2VExtend」というノードを複数重ねて動画にしているみたいです。

１つにつき（ChunkLength　/　fps）秒で、デフォルトではChunkLengthは77、fpsは16です。

これが3つあるので（ChunkLength　/　fps）×3　で　14.4375秒　なのです。

ChunkLengthの値はワークフローの注意書きに以下のように書かれていたので77固定です。

WAN2.2S2Vの公式コードでは、77がデフォルトの長さです。このモデルでは少なくとも73フレームが必要です。値を高く設定しすぎると、メモリ不足の問題が発生する可能性があります。

そのため、77のままで問題ありません

なので、動画の長さを変更できる場所は、fpsの値とVideoS2VExtendの数になってきます。

ちょっと面倒なので、デフォルトの14.4375秒で進めていきます。

歌わせてみる

次に、以前AIで作った「オリジナル楽曲」を使って、MV風の動画を作ってみることにしました。

画像: 1枚のイラスト
音声: 歌入りの楽曲ファイル（出だしからすぐ歌が始まるタイプ）

結果： 生成された動画を見ると、歌詞に合わせて口が動いており、一見すると完璧なリップシンク動画に見えました。しかし、ここでふと昔の記憶が蘇りました。以前、別のリップシンクツールを使った時に**「ボーカル以外の音（ドラムやベース）にも反応して口が動いてしまう」**という現象があったのです。

歌ってみたのじゃ🎵

音楽と1枚のイラストで作った動画

ComfyUIでのローカル生成なのじゃ

リップシンクは完璧とは言えないが、まあこんなもんじゃろう😉

まだ試していないが、気になる点は音声以外にもリップシンクが反応してしまうかどうか🤔

ちょっと反応してそうな気が😅 pic.twitter.com/HMQbw9IbP4
— セレスティア💖学園長 (@owata_aiart) February 16, 2026

「もしかして、今回もうまくいったように見えているだけで、実は全部の音に反応しているのでは？」

検証：イントロのある曲で試す

疑念を晴らすため、あえて意地悪なテストを行いました。

音声: 「歌 → 長い間奏（イントロ） → 歌」 という構成の楽曲

もしAIが賢く「人の声」だけを認識しているなら、間奏部分は口を閉じるはずです。

結果： ダメでした。 予想通り、キャラクターはギターのイントロに合わせて楽しそうに口をパクパクさせていました。 これでは「歌っている」のではなく「音に合わせて顎が振動している」だけです。これではMVとしては使えません。

予想どおりじゃった・・・

音声だけでなく音そのものに反応して口パクしてしまうのじゃ・・

楽してこのワークフローだけでMVは作れなさそうじゃな🥴

しかしローカルでこのクオリティでリップシンクが出来るのはかなりデカいのじゃ😉

ちなみにこの動画のプロンプトは👇
The woman dances with great… https://t.co/yrc0HqJC9i pic.twitter.com/0LfhJXlUga
— セレスティア💖学園長 (@owata_aiart) February 16, 2026