Skip to content
Devenir Parrain Aidez à Construire une Meilleure Base de Connaissances ComfyUI
Série de TutorielsTutoriel Avancé ComfyUIFlux de travail Wan2.1 ComfyUI - Guide complet

Flux de travail Wan2.1 ComfyUI

Wan2.1, publié en open source par Alibaba en février 2025, est un modèle de référence dans le domaine de la génération vidéo, sous licence Apache 2.0. Il propose deux versions : 14B (14 milliards de paramètres) et 1.3B (1,3 milliard de paramètres), couvrant des tâches comme le texte vers vidéo (T2V), l’image vers vidéo (I2V) et plus encore. Ce modèle surpasse non seulement les modèles open source existants en termes de performance, mais sa version légère ne nécessite que 8 Go de VRAM, réduisant considérablement la barrière d’entrée.

Actuellement, tous les modèles sont disponibles au téléchargement sur les plateformes Hugging Face et ModelScope :

Cet article vous guidera à travers les flux de travail liés à Wan2.1, notamment :

  • L’installation des modèles Wan2.1
  • Le flux de travail d’image vers vidéo avec Wan2.1
  • La configuration du flux de travail de texte vers vidéo avec Wan2.1

De plus, la communauté a créé des versions GGUF et quantifiées :

Exemples officiels de flux de travail Wan2.1 ComfyUI

Les flux de travail suivants proviennent du blog officiel de ComfyUI, car ComfyUI prend désormais en charge nativement Wan2.1

1. Installation liée à Wan2.1

  1. Mettez à jour ComfyUI vers la dernière version

Assurez-vous de mettre à jour votre version de ComfyUI vers la plus récente, consultez le guide Comment mettre à jour ComfyUI pour compléter la mise à jour.

  1. Installation des modèles de diffusion

Diffusion models

Téléchargez une version du modèle depuis le dépôt reconditionnée de Comfy selon le type de flux de travail dont vous avez besoin :

  • i2v est pour image to video (image vers vidéo), t2v est pour text to video (texte vers vidéo)
  • 14B et 1.3B représentent le nombre de paramètres ; plus le nombre est élevé, plus les exigences matérielles sont importantes
  • bf16, fp16, fp8 représentent différentes précisions ; une précision plus élevée signifie des exigences matérielles plus importantes, fp8 étant la précision la plus basse avec des exigences moindres mais des résultats relativement inférieurs
  • Généralement, plus la taille du fichier est grande, plus les exigences matérielles sont élevées

Enregistrez les modèles téléchargés dans le répertoire ComfyUI/models/diffusion_models

  1. Installation des modèles d’encodeurs de texte

Cliquez pour télécharger umt5_xxl_fp8_e4m3fn_scaled.safetensors

Si le téléchargement ne répond pas, visitez ce lien pour télécharger

Enregistrez le modèle téléchargé dans le répertoire ComfyUI/models/text_encoders

  1. Installation du modèle clip_vision

Cliquez pour télécharger clip_vision_h.safetensors

Si le téléchargement ne répond pas, visitez ce lien pour télécharger

Enregistrez le modèle téléchargé dans le répertoire ComfyUI/models/clip_vision

  1. Installation du modèle VAE Wan2.1

Cliquez pour télécharger wan_2.1_vae.safetensors

Si le téléchargement ne répond pas, visitez ce lien pour télécharger

Enregistrez le modèle téléchargé dans le répertoire ComfyUI/models/vae

2. Flux de travail d’image vers vidéo Wan2.1

Les deux flux de travail suivants ont des nœuds de base similaires, la différence réside dans le modèle de diffusion utilisé et la taille de vidéo correspondante. Vous pouvez utiliser les fichiers de flux de travail fournis ci-dessous, ou en utiliser un et suivre mes conseils pour modifier les paramètres.

2.1 Flux de travail d’image vers vidéo Wan2.1 14B 720P

Téléchargement du fichier de flux de travail Cliquez sur le bouton ci-dessous pour télécharger le flux de travail correspondant, puis faites-le glisser dans l’interface ComfyUI ou utilisez la barre de menu Workflows -> Open(Ctrl+O) pour le charger

Exemple d’image d’entrée Veuillez télécharger cette image pour l’utiliser comme entrée Exemple d'image d'entrée pour le flux de travail d'image vers vidéo Wan2.1 14B 720P

Explication du flux de travail d’image vers vidéo Wan2.1 720P Flux de travail d'image vers vidéo Wan2.1 14B 720P

Veuillez vous référer aux numéros sur l’image, assurez-vous que les nœuds et modèles correspondants sont chargés pour garantir le bon fonctionnement du modèle

  1. Veuillez télécharger l’exemple d’image d’entrée fourni précédemment
  2. Assurez-vous que le modèle [clip_vision_h.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/clip_vision/clip_vision_h.safetensors?download=true) peut être lu et chargé normalement
  3. Assurez-vous que le modèle [umt5_xxl_fp8_e4m3fn_scaled.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors?download=true) peut être lu et chargé normalement
  4. Assurez-vous d’utiliser le modèle 720P et qu’il peut être lu normalement, si vous ne l’avez pas téléchargé, cliquez ici pour le télécharger, l’un des deux suivants selon les performances de votre appareil
    • wan2.1_i2v_720p_14B_bf16.safetensors
    • wan2.1_i2v_720p_14B_fp8_e4m3fn.safetensors
  5. Assurez-vous que le modèle [wan_2.1_vae.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/vae/wan_2.1_vae.safetensors?download=true) peut être lu et chargé normalement
  6. Cliquez sur le bouton Queue, ou utilisez le raccourci Ctrl(cmd) + Enter pour exécuter la génération de vidéo
  7. Vous pouvez noter que la taille du nœud wanImageToVideo est de 768x768

2.2 Flux de travail d’image vers vidéo Wan2.1 14B 480P

Le flux de travail 480P est similaire au flux de travail 720P, la principale différence étant que le nœud LoadDiffusion Model charge le modèle 480P, et que la taille du nœud wanImageToVideo est de 512x512

Téléchargement du fichier de flux de travail Cliquez sur le bouton ci-dessous pour télécharger le flux de travail correspondant, puis faites-le glisser dans l’interface ComfyUI ou utilisez la barre de menu Workflows -> Open(Ctrl+O) pour le charger

Exemple d’image d’entrée Veuillez télécharger l’image ci-dessous pour l’utiliser comme entrée flux_dev_example

Explication du flux de travail d’image vers vidéo Wan2.1 480P Flux de travail d'image vers vidéo Wan2.1 14B 480P

Explication du flux de travail d’image vers vidéo Wan2.1 480P Flux de travail d'image vers vidéo Wan2.1 14B 480P

Veuillez vous référer aux numéros sur l’image, assurez-vous que les nœuds et modèles correspondants sont chargés pour garantir le bon fonctionnement du modèle

  1. Veuillez télécharger l’exemple d’image d’entrée fourni précédemment
  2. Assurez-vous que le modèle [clip_vision_h.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/clip_vision/clip_vision_h.safetensors?download=true) peut être lu et chargé normalement
  3. Assurez-vous que le modèle [umt5_xxl_fp8_e4m3fn_scaled.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors?download=true) peut être lu et chargé normalement
  4. Assurez-vous d’utiliser le modèle 480P et qu’il peut être lu normalement, si vous ne l’avez pas téléchargé, cliquez ici pour le télécharger, l’un des deux suivants selon les performances de votre appareil
    • wan2.1_i2v_480p_14B_bf16.safetensors
    • wan2.1_i2v_480p_14B_fp8_e4m3fn.safetensors
  5. Assurez-vous que le modèle [wan_2.1_vae.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/vae/wan_2.1_vae.safetensors?download=true) peut être lu et chargé normalement
  6. Cliquez sur le bouton Queue, ou utilisez le raccourci Ctrl(cmd) + Enter pour exécuter la génération de vidéo
  7. Vous pouvez noter que la taille du nœud wanImageToVideo est de 512x512
  8. 你可以留意此处wanImageToVideo节点的尺寸为 512x512

3. Flux de travail d’image vers vidéo Wan2.1 1.3B 1080P

Veuillez cliquer sur le bouton ci-dessous pour télécharger le flux de travail correspondant, puis faites-le glisser dans l’interface ComfyUI ou utilisez la barre de menu Workflows -> Open(Ctrl+O) pour le charger

Flux de travail d'image vers vidéo Wan2.1 1.3B 1080P

Veuillez vous référer aux numéros sur l’image, assurez-vous que les nœuds et modèles correspondants sont chargés pour garantir le bon fonctionnement du modèle

  1. Assurez-vous que le modèle [umt5_xxl_fp8_e4m3fn_scaled.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors?download=true) peut être lu et chargé normalement
  2. Assurez-vous d’utiliser le modèle t2v et qu’il peut être lu normalement, si vous ne l’avez pas téléchargé, cliquez ici pour le télécharger, l’un des suivants selon les performances de votre appareil
    • wan2.1_t2v_1.3B_bf16.safetensors
    • wan2.1_t2v_1.3B_fp16.safetensors
    • wan2.1_t2v_14B_bf16.safetensors
    • wan2.1_t2v_14B_fp8_e4m3fn.safetensors
  3. Assurez-vous que le modèle [wan_2.1_vae.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/vae/wan_2.1_vae.safetensors?download=true) peut être lu et chargé normalement
  4. Cliquez sur le bouton Queue, ou utilisez le raccourci Ctrl(cmd) + Enter pour exécuter la génération de vidéo

Flux de travail de la version quantifiée Wan2.1

Cette version est fournie par Kijai et nécessite l’utilisation de plugins Vous devez installer les deux plugins suivants :

Téléchargement des modèles pour la version quantifiée Wan2.1

Tous les modèles proviennent de : Kijai/WanVideo_comfy

Modèles d’encodeurs de texte

Veuillez choisir la version fp8 ou bf16 selon votre appareil, télécharger les fichiers ci-dessous et les enregistrer dans le dossier ComfyUI/models/text_encoders

La version fp8 nécessite moins de performances matérielles, tandis que la version bf16 nécessite des performances matérielles plus élevées

Modèles de diffusion

Veuillez télécharger le modèle Transformer correspondant à votre appareil et au flux de travail souhaité dans le dossier ComfyUI/models/diffusion_models

Explication des paramètres des fichiers de modèle : 1. Type de modèle

  • I2V : Image to Video, modèle de génération de vidéo à partir d’image
  • T2V : Text to Video, modèle de génération de vidéo à partir de texte

2. Taille du modèle

  • 14B : Version à 14 milliards de paramètres, meilleur effet mais exigences matérielles plus élevées
  • 1_3B : Version à 1,3 milliard de paramètres, exigences matérielles plus faibles mais effet relativement simple

3. Résolution

  • 480P : Génère des vidéos en résolution 512x512
  • 720P : Génère des vidéos en résolution 768x768

4. Format de précision

  • bf16 : Brain Floating Point 16, précision plus élevée, nécessite un GPU plus récent
  • fp8 : Floating Point 8, précision plus faible, exigences matérielles plus faibles
  • fp16 : Floating Point 16, précision moyenne, adapté à la plupart des GPU
  • e4m3fn : Un type de format flottant 8 bits, optimisé pour les calculs à basse précision

Modèles VAE

Veuillez choisir la version fp8 ou bf16 selon votre appareil, télécharger les fichiers ci-dessous et les enregistrer dans le dossier ComfyUI/models/vae

Flux de travail de la version quantifiée Wan2.1

Flux de travail de texte vers vidéo de la version quantifiée Wan2.1

Veuillez cliquer sur le bouton ci-dessous pour télécharger le flux de travail correspondant, puis faites-le glisser dans l’interface ComfyUI ou utilisez la barre de menu Workflows -> Open(Ctrl+O) pour le charger

Explication du flux de travail Flux de travail de texte vers vidéo de la version quantifiée Wan2.1

Veuillez vous référer aux numéros sur l’image, assurez-vous que les nœuds et modèles correspondants sont chargés pour garantir le bon fonctionnement du modèle

  1. Assurez-vous que le modèle [umt5-xxl-enc-bf16.safetensors](https://huggingface.co/Kijai/WanVideo_comfy/blob/main/umt5-xxl-enc-bf16.safetensors) peut être lu et chargé normalement
  2. Assurez-vous d’utiliser le modèle t2v et qu’il peut être lu normalement, si vous ne l’avez pas téléchargé, cliquez ici pour le télécharger, l’un des deux suivants selon les performances de votre appareil
  3. Assurez-vous que le modèle Wan2_1_VAE_xxx.safetensors peut être lu et chargé normalement
  4. Cliquez sur le bouton Queue, ou utilisez le raccourci Ctrl(cmd) + Enter pour exécuter la génération de vidéo

Flux de travail d’image vers vidéo 480P de la version quantifiée Wan2.1

Téléchargement du modèle CLIP

Téléchargement du flux de travail Veuillez cliquer sur le bouton ci-dessous pour télécharger le flux de travail correspondant, puis faites-le glisser dans l’interface ComfyUI ou utilisez la barre de menu Workflows -> Open(Ctrl+O) pour le charger

Explication du flux de travail Explication du flux de travail d'image vers vidéo 480P de la version quantifiée Wan2.1

Veuillez vous référer aux numéros sur l’image, assurez-vous que les nœuds et modèles correspondants sont chargés pour garantir le bon fonctionnement du modèle

  1. Assurez-vous que le modèle umt5-xxl-enc-bf16.safetensors peut être lu et chargé normalement, lien de téléchargement : umt5-xxl-enc-bf16.safetensors
  2. Assurez-vous que le modèle open-clip-xlm-roberta-large-vit-huge-14_fp16.safetensors peut être lu et chargé normalement, lien de téléchargement : open-clip-xlm-roberta-large-vit-huge-14_fp16.safetensors
  3. Assurez-vous que le modèle Wan2_1_VAE_bf16.safetensors peut être lu et chargé normalement, lien de téléchargement : Wan2_1_VAE_bf16.safetensors
  4. Téléchargez l’image à partir de laquelle vous souhaitez générer une vidéo
  5. Assurez-vous que le modèle Wan2_1-I2V-14B-480P_fp8_e4m3fn.safetensors peut être lu et chargé normalement, lien de téléchargement : Wan2_1-I2V-14B-480P_fp8_e4m3fn.safetensors
  6. Entrez la description du contenu vidéo que vous souhaitez générer dans la zone de texte
  7. Cliquez sur le bouton Queue, ou utilisez le raccourci Ctrl(cmd) + Enter pour exécuter la génération de vidéo

Flux de travail de vidéo vers vidéo de la version quantifiée Wan2.1

Téléchargement du flux de travail Veuillez cliquer sur le bouton ci-dessous pour télécharger le flux de travail correspondant, puis faites-le glisser dans l’interface ComfyUI ou utilisez la barre de menu Workflows -> Open(Ctrl+O) pour le charger

Explication du flux de travail Flux de travail de vidéo vers vidéo de la version quantifiée Wan2.1

Veuillez vous référer aux numéros sur l’image, assurez-vous que les nœuds et modèles correspondants sont chargés pour garantir le bon fonctionnement du modèle

  1. Assurez-vous que le modèle umt5-xxl-enc-bf16.safetensors peut être lu et chargé normalement, lien de téléchargement : umt5-xxl-enc-bf16.safetensors
  2. Veuillez télécharger la vidéo originale que vous souhaitez transformer
  3. Assurez-vous que le modèle Wan2_1-T2V-1_3B_bf16.safetensors peut être lu et chargé normalement, lien de téléchargement : Wan2_1-T2V-1_3B_bf16.safetensors
  4. Veuillez entrer la description du contenu vidéo que vous souhaitez générer
  5. Assurez-vous que le modèle Wan2_1_VAE_bf16.safetensors peut être lu et chargé normalement, lien de téléchargement : Wan2_1_VAE_bf16.safetensors
  6. Cliquez sur le bouton Queue, ou utilisez le raccourci Ctrl(cmd) + Enter pour exécuter la génération de vidéo

Ressources connexes