Flux de travail Wan2.1 ComfyUI
Wan2.1, publié en open source par Alibaba en février 2025, est un modèle de référence dans le domaine de la génération vidéo, sous licence Apache 2.0. Il propose deux versions : 14B (14 milliards de paramètres) et 1.3B (1,3 milliard de paramètres), couvrant des tâches comme le texte vers vidéo (T2V), l’image vers vidéo (I2V) et plus encore. Ce modèle surpasse non seulement les modèles open source existants en termes de performance, mais sa version légère ne nécessite que 8 Go de VRAM, réduisant considérablement la barrière d’entrée.
Actuellement, tous les modèles sont disponibles au téléchargement sur les plateformes Hugging Face et ModelScope :
- T2V-14B:Hugging Face | ModelScope
- I2V-14B-720P:Hugging Face | ModelScope
- T2V-1.3B:Hugging Face | ModelScope
Cet article vous guidera à travers les flux de travail liés à Wan2.1, notamment :
- L’installation des modèles Wan2.1
- Le flux de travail d’image vers vidéo avec Wan2.1
- La configuration du flux de travail de texte vers vidéo avec Wan2.1
De plus, la communauté a créé des versions GGUF et quantifiées :
- GGUF : https://huggingface.co/city96/Wan2.1-T2V-14B-gguf/tree/main
- Version quantifiée : https://huggingface.co/Kijai/WanVideo_comfy/tree/main
Exemples officiels de flux de travail Wan2.1 ComfyUI
Les flux de travail suivants proviennent du blog officiel de ComfyUI, car ComfyUI prend désormais en charge nativement Wan2.1
1. Installation liée à Wan2.1
- Mettez à jour ComfyUI vers la dernière version
Assurez-vous de mettre à jour votre version de ComfyUI vers la plus récente, consultez le guide Comment mettre à jour ComfyUI pour compléter la mise à jour.
- Installation des modèles de diffusion
Téléchargez une version du modèle depuis le dépôt reconditionnée de Comfy selon le type de flux de travail dont vous avez besoin :
- i2v est pour image to video (image vers vidéo), t2v est pour text to video (texte vers vidéo)
- 14B et 1.3B représentent le nombre de paramètres ; plus le nombre est élevé, plus les exigences matérielles sont importantes
- bf16, fp16, fp8 représentent différentes précisions ; une précision plus élevée signifie des exigences matérielles plus importantes, fp8 étant la précision la plus basse avec des exigences moindres mais des résultats relativement inférieurs
- Généralement, plus la taille du fichier est grande, plus les exigences matérielles sont élevées
Enregistrez les modèles téléchargés dans le répertoire ComfyUI/models/diffusion_models
- Installation des modèles d’encodeurs de texte
Cliquez pour télécharger umt5_xxl_fp8_e4m3fn_scaled.safetensors
Si le téléchargement ne répond pas, visitez ce lien pour télécharger
Enregistrez le modèle téléchargé dans le répertoire ComfyUI/models/text_encoders
- Installation du modèle clip_vision
Cliquez pour télécharger clip_vision_h.safetensors
Si le téléchargement ne répond pas, visitez ce lien pour télécharger
Enregistrez le modèle téléchargé dans le répertoire ComfyUI/models/clip_vision
- Installation du modèle VAE Wan2.1
Cliquez pour télécharger wan_2.1_vae.safetensors
Si le téléchargement ne répond pas, visitez ce lien pour télécharger
Enregistrez le modèle téléchargé dans le répertoire ComfyUI/models/vae
2. Flux de travail d’image vers vidéo Wan2.1
Les deux flux de travail suivants ont des nœuds de base similaires, la différence réside dans le modèle de diffusion utilisé et la taille de vidéo correspondante. Vous pouvez utiliser les fichiers de flux de travail fournis ci-dessous, ou en utiliser un et suivre mes conseils pour modifier les paramètres.
2.1 Flux de travail d’image vers vidéo Wan2.1 14B 720P
Téléchargement du fichier de flux de travail
Cliquez sur le bouton ci-dessous pour télécharger le flux de travail correspondant, puis faites-le glisser dans l’interface ComfyUI ou utilisez la barre de menu Workflows
-> Open(Ctrl+O)
pour le charger
Exemple d’image d’entrée
Veuillez télécharger cette image pour l’utiliser comme entrée
Explication du flux de travail d’image vers vidéo Wan2.1 720P
Veuillez vous référer aux numéros sur l’image, assurez-vous que les nœuds et modèles correspondants sont chargés pour garantir le bon fonctionnement du modèle
- Veuillez télécharger l’exemple d’image d’entrée fourni précédemment
- Assurez-vous que le modèle
[clip_vision_h.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/clip_vision/clip_vision_h.safetensors?download=true)
peut être lu et chargé normalement - Assurez-vous que le modèle
[umt5_xxl_fp8_e4m3fn_scaled.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors?download=true)
peut être lu et chargé normalement - Assurez-vous d’utiliser le modèle 720P et qu’il peut être lu normalement, si vous ne l’avez pas téléchargé, cliquez ici pour le télécharger, l’un des deux suivants selon les performances de votre appareil
- wan2.1_i2v_720p_14B_bf16.safetensors
- wan2.1_i2v_720p_14B_fp8_e4m3fn.safetensors
- Assurez-vous que le modèle
[wan_2.1_vae.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/vae/wan_2.1_vae.safetensors?download=true)
peut être lu et chargé normalement - Cliquez sur le bouton
Queue
, ou utilisez le raccourciCtrl(cmd) + Enter
pour exécuter la génération de vidéo - Vous pouvez noter que la taille du nœud
wanImageToVideo
est de 768x768
2.2 Flux de travail d’image vers vidéo Wan2.1 14B 480P
Le flux de travail 480P est similaire au flux de travail 720P, la principale différence étant que le nœud LoadDiffusion Model
charge le modèle 480P, et que la taille du nœud wanImageToVideo
est de 512x512
Téléchargement du fichier de flux de travail
Cliquez sur le bouton ci-dessous pour télécharger le flux de travail correspondant, puis faites-le glisser dans l’interface ComfyUI ou utilisez la barre de menu Workflows
-> Open(Ctrl+O)
pour le charger
Exemple d’image d’entrée
Veuillez télécharger l’image ci-dessous pour l’utiliser comme entrée
Explication du flux de travail d’image vers vidéo Wan2.1 480P
Explication du flux de travail d’image vers vidéo Wan2.1 480P
Veuillez vous référer aux numéros sur l’image, assurez-vous que les nœuds et modèles correspondants sont chargés pour garantir le bon fonctionnement du modèle
- Veuillez télécharger l’exemple d’image d’entrée fourni précédemment
- Assurez-vous que le modèle
[clip_vision_h.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/clip_vision/clip_vision_h.safetensors?download=true)
peut être lu et chargé normalement - Assurez-vous que le modèle
[umt5_xxl_fp8_e4m3fn_scaled.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors?download=true)
peut être lu et chargé normalement - Assurez-vous d’utiliser le modèle 480P et qu’il peut être lu normalement, si vous ne l’avez pas téléchargé, cliquez ici pour le télécharger, l’un des deux suivants selon les performances de votre appareil
- wan2.1_i2v_480p_14B_bf16.safetensors
- wan2.1_i2v_480p_14B_fp8_e4m3fn.safetensors
- Assurez-vous que le modèle
[wan_2.1_vae.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/vae/wan_2.1_vae.safetensors?download=true)
peut être lu et chargé normalement - Cliquez sur le bouton
Queue
, ou utilisez le raccourciCtrl(cmd) + Enter
pour exécuter la génération de vidéo - Vous pouvez noter que la taille du nœud
wanImageToVideo
est de 512x512 - 你可以留意此处
wanImageToVideo
节点的尺寸为 512x512
3. Flux de travail d’image vers vidéo Wan2.1 1.3B 1080P
Veuillez cliquer sur le bouton ci-dessous pour télécharger le flux de travail correspondant, puis faites-le glisser dans l’interface ComfyUI ou utilisez la barre de menu Workflows
-> Open(Ctrl+O)
pour le charger
Veuillez vous référer aux numéros sur l’image, assurez-vous que les nœuds et modèles correspondants sont chargés pour garantir le bon fonctionnement du modèle
- Assurez-vous que le modèle
[umt5_xxl_fp8_e4m3fn_scaled.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors?download=true)
peut être lu et chargé normalement - Assurez-vous d’utiliser le modèle t2v et qu’il peut être lu normalement, si vous ne l’avez pas téléchargé, cliquez ici pour le télécharger, l’un des suivants selon les performances de votre appareil
- wan2.1_t2v_1.3B_bf16.safetensors
- wan2.1_t2v_1.3B_fp16.safetensors
- wan2.1_t2v_14B_bf16.safetensors
- wan2.1_t2v_14B_fp8_e4m3fn.safetensors
- Assurez-vous que le modèle
[wan_2.1_vae.safetensors](https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/resolve/main/split_files/vae/wan_2.1_vae.safetensors?download=true)
peut être lu et chargé normalement - Cliquez sur le bouton
Queue
, ou utilisez le raccourciCtrl(cmd) + Enter
pour exécuter la génération de vidéo
Flux de travail de la version quantifiée Wan2.1
Cette version est fournie par Kijai et nécessite l’utilisation de plugins Vous devez installer les deux plugins suivants :
Téléchargement des modèles pour la version quantifiée Wan2.1
Tous les modèles proviennent de : Kijai/WanVideo_comfy
Modèles d’encodeurs de texte
Veuillez choisir la version fp8 ou bf16 selon votre appareil, télécharger les fichiers ci-dessous et les enregistrer dans le dossier ComfyUI/models/text_encoders
La version fp8 nécessite moins de performances matérielles, tandis que la version bf16 nécessite des performances matérielles plus élevées
Modèles de diffusion
Veuillez télécharger le modèle Transformer correspondant à votre appareil et au flux de travail souhaité dans le dossier ComfyUI/models/diffusion_models
- Wan2_1-I2V-14B-480P_fp8_e4m3fn.safetensors
- Wan2_1-I2V-14B-720P_fp8_e4m3fn.safetensors
- Wan2_1-T2V-14B_fp8_e4m3fn.safetensors
- Wan2_1-T2V-1_3B_bf16.safetensors
- Wan2_1-T2V-1_3B_fp8_e4m3fn.safetensors
Explication des paramètres des fichiers de modèle : 1. Type de modèle
- I2V : Image to Video, modèle de génération de vidéo à partir d’image
- T2V : Text to Video, modèle de génération de vidéo à partir de texte
2. Taille du modèle
- 14B : Version à 14 milliards de paramètres, meilleur effet mais exigences matérielles plus élevées
- 1_3B : Version à 1,3 milliard de paramètres, exigences matérielles plus faibles mais effet relativement simple
3. Résolution
- 480P : Génère des vidéos en résolution 512x512
- 720P : Génère des vidéos en résolution 768x768
4. Format de précision
- bf16 : Brain Floating Point 16, précision plus élevée, nécessite un GPU plus récent
- fp8 : Floating Point 8, précision plus faible, exigences matérielles plus faibles
- fp16 : Floating Point 16, précision moyenne, adapté à la plupart des GPU
- e4m3fn : Un type de format flottant 8 bits, optimisé pour les calculs à basse précision
Modèles VAE
Veuillez choisir la version fp8 ou bf16 selon votre appareil, télécharger les fichiers ci-dessous et les enregistrer dans le dossier ComfyUI/models/vae
Flux de travail de la version quantifiée Wan2.1
Flux de travail de texte vers vidéo de la version quantifiée Wan2.1
Veuillez cliquer sur le bouton ci-dessous pour télécharger le flux de travail correspondant, puis faites-le glisser dans l’interface ComfyUI ou utilisez la barre de menu Workflows
-> Open(Ctrl+O)
pour le charger
Explication du flux de travail
Veuillez vous référer aux numéros sur l’image, assurez-vous que les nœuds et modèles correspondants sont chargés pour garantir le bon fonctionnement du modèle
- Assurez-vous que le modèle
[umt5-xxl-enc-bf16.safetensors](https://huggingface.co/Kijai/WanVideo_comfy/blob/main/umt5-xxl-enc-bf16.safetensors)
peut être lu et chargé normalement - Assurez-vous d’utiliser le modèle t2v et qu’il peut être lu normalement, si vous ne l’avez pas téléchargé, cliquez ici pour le télécharger, l’un des deux suivants selon les performances de votre appareil
- Assurez-vous que le modèle
Wan2_1_VAE_xxx.safetensors
peut être lu et chargé normalement - Cliquez sur le bouton
Queue
, ou utilisez le raccourciCtrl(cmd) + Enter
pour exécuter la génération de vidéo
Flux de travail d’image vers vidéo 480P de la version quantifiée Wan2.1
Téléchargement du modèle CLIP
- open-clip-xlm-roberta-large-vit-huge-14_fp16.safetensors
- open-clip-xlm-roberta-large-vit-huge-14_visual_fp32.safetensors
- open-clip-xlm-roberta-large-vit-huge-14_visual_fp32.safetensors
Téléchargement du flux de travail
Veuillez cliquer sur le bouton ci-dessous pour télécharger le flux de travail correspondant, puis faites-le glisser dans l’interface ComfyUI ou utilisez la barre de menu Workflows
-> Open(Ctrl+O)
pour le charger
Explication du flux de travail
Veuillez vous référer aux numéros sur l’image, assurez-vous que les nœuds et modèles correspondants sont chargés pour garantir le bon fonctionnement du modèle
- Assurez-vous que le modèle
umt5-xxl-enc-bf16.safetensors
peut être lu et chargé normalement, lien de téléchargement : umt5-xxl-enc-bf16.safetensors - Assurez-vous que le modèle
open-clip-xlm-roberta-large-vit-huge-14_fp16.safetensors
peut être lu et chargé normalement, lien de téléchargement : open-clip-xlm-roberta-large-vit-huge-14_fp16.safetensors - Assurez-vous que le modèle
Wan2_1_VAE_bf16.safetensors
peut être lu et chargé normalement, lien de téléchargement : Wan2_1_VAE_bf16.safetensors - Téléchargez l’image à partir de laquelle vous souhaitez générer une vidéo
- Assurez-vous que le modèle
Wan2_1-I2V-14B-480P_fp8_e4m3fn.safetensors
peut être lu et chargé normalement, lien de téléchargement : Wan2_1-I2V-14B-480P_fp8_e4m3fn.safetensors - Entrez la description du contenu vidéo que vous souhaitez générer dans la zone de texte
- Cliquez sur le bouton
Queue
, ou utilisez le raccourciCtrl(cmd) + Enter
pour exécuter la génération de vidéo
Flux de travail de vidéo vers vidéo de la version quantifiée Wan2.1
Téléchargement du flux de travail
Veuillez cliquer sur le bouton ci-dessous pour télécharger le flux de travail correspondant, puis faites-le glisser dans l’interface ComfyUI ou utilisez la barre de menu Workflows
-> Open(Ctrl+O)
pour le charger
Explication du flux de travail
Veuillez vous référer aux numéros sur l’image, assurez-vous que les nœuds et modèles correspondants sont chargés pour garantir le bon fonctionnement du modèle
- Assurez-vous que le modèle
umt5-xxl-enc-bf16.safetensors
peut être lu et chargé normalement, lien de téléchargement : umt5-xxl-enc-bf16.safetensors - Veuillez télécharger la vidéo originale que vous souhaitez transformer
- Assurez-vous que le modèle Wan2_1-T2V-1_3B_bf16.safetensors peut être lu et chargé normalement, lien de téléchargement : Wan2_1-T2V-1_3B_bf16.safetensors
- Veuillez entrer la description du contenu vidéo que vous souhaitez générer
- Assurez-vous que le modèle Wan2_1_VAE_bf16.safetensors peut être lu et chargé normalement, lien de téléchargement : Wan2_1_VAE_bf16.safetensors
- Cliquez sur le bouton
Queue
, ou utilisez le raccourciCtrl(cmd) + Enter
pour exécuter la génération de vidéo
Ressources connexes
- Dépôt GitHub du modèle Wan2.1
- Plateforme de démonstration en ligne du modèle Wan2.1
- Documentation technique du modèle Wan2.1
- Communauté de développeurs du modèle Wan2.1
- Modèle Wan2.1 ComfyUI Repackaged
- Exemples de flux de travail ComfyUI pour le modèle Wan2.1
- Téléchargement du modèle Wan2.1 gguf
- Téléchargement de la version quantifiée du modèle Wan2.1