Skip to content
Aidez à Construire une Meilleure Base de Connaissances ComfyUI Devenir Parrain
ActualitésLe modèle de génération de vidéos Wan2.1 d'Alibaba officiellement ouvert
Aucun article pour le moment. Revenez plus tard !

Le modèle de génération de vidéos Wan2.1 d’Alibaba officiellement ouvert

Le 25 février 2025, Alibaba a annoncé que son modèle de génération de vidéos le plus récent, Wan2.1, a été officiellement ouvert, marquant un jalon important. Ce modèle ne dépasse pas uniquement les modèles open-source existants en termes de performance, mais réduit également considérablement le seuil d’entrée avec sa version légère nécessitant seulement 8 Go de mémoire vidéo.

Points forts

Wan2.1 a réalisé des percées technologiques significatives dans plusieurs domaines :

1. Performance exceptionnelle et faibles exigences en ressources

  • Classé premier sur le classement VBench avec un score total de 86,22%, surpassant des modèles comme Sora (84,28%) et Luma (83,61%)
  • La version légère T2V-1.3B nécessite seulement 8,19 Go de mémoire vidéo, permettant de fonctionner sur des cartes graphiques de consommation
  • Supporte la génération de vidéos en résolution 8K avec des détails atteignant les normes cinématographiques

2. Support fonctionnel complet

  • Supporte plusieurs tâches telles que la génération de vidéos à partir de texte (T2V), d’images (I2V) et l’édition de vidéos
  • Introduit pour la première fois la génération d’effets de texte bilingues (chinois et anglais), supportant les sous-titres dynamiques et les polices artistiques
  • Ajoute la fonctionnalité de génération d’audio à partir de vidéos (V2A), réalisant une génération synchronisée de l’audio et de la vidéo

3. Architecture technique innovante

  • Formé en utilisant le paradigme de Flow Matching de trajectoire bruitée linéaire
  • Le Wan-VAE peut gérer des vidéos de n’importe quelle longueur en résolution 1080P
  • Le module de convolution causal 3D améliore les capacités de simulation physique

Sélection de version et exigences matérielles

Wan2.1 offre deux versions pour répondre à différents scénarios :

  1. Édition rapide (1.3B)

    • Nécessite seulement 8,19 Go de mémoire vidéo
    • Convenable pour les développeurs individuels
    • Le temps de génération d’une vidéo de 5 secondes en 480P est d’environ 4 minutes
  2. Édition professionnelle (14B)

    • Supporte le rendu professionnel en 720P
    • Convenable pour les applications industrielles du cinéma et de la télévision
    • Offre une interface plus riche pour les effets spéciaux

Acquisition de ressources open-source

Tous les modèles sont maintenant disponibles pour téléchargement sur les plateformes Hugging Face et ModelScope :

Scénarios d’application

L’application de Wan2.1 est large, comprenant principalement :

Création personnelle

  • Génération de contenu de vidéos courtes
  • Aide à la création artistique
  • Animation d’images

Production professionnelle

  • Production d’effets spéciaux pour le cinéma et la télévision
  • Conception créative publicitaire
  • Production de ressources éducatives

Application industrielle

  • Animation de produits
  • Présentation d’effets pour l’architecture
  • Visualisation de processus industriels

Avenir

L’ouverture de Wan2.1 apportera de nouvelles opportunités pour la création de vidéos AI. En particulier, ses faibles exigences matérielles permettront à plus de développeurs individuels et de petites équipes de participer à la pratique de la génération de vidéos AI. Cela ne fera pas que promouvoir la diffusion de la technologie, mais également stimuler le développement de l’industrie dans son ensemble.

Liens associés