OpenMOSS 发布 MOVA - 开源音视频同步生成模型

2026/01/29

Wan2.2 Fun InP ComfyUI 工作流完整使用指南，官方+社区版本（Kijai, GGUF）工作流全攻略

教程总览

本教程将全面介绍 Wan2.2 Fun InP 首尾帧视频生成模型在 ComfyUI 中的各种实现方式和使用方法。Wan2.2 Fun InP 是阿里云推出的专业首尾帧控制视频生成模型，支持输入首帧和尾帧图像，生成中间过渡视频，为创作者带来更强的创意控制力。

本教程涵盖的版本和内容

已完成的版本：

✅ ComfyUI 官方原生版本 - 由 ComfyOrg 官方提供的完整工作流
✅ Wan2.2 Fun InP 14B 首尾帧版本 - 高质量首尾帧控制视频生成

正在准备中的版本：

🔄 Kijai WanVideoWrapper 版本 - 社区开发的便捷包装器
🔄 GGUF 量化版本 - 适用于低配置设备的优化版本

模型技术特点

Wan2.2 Fun InP 基于 Wan2.2 架构，专门针对首尾帧控制视频生成进行了优化，具备以下核心特性：

核心优势：

首尾帧控制：支持输入首帧和尾帧图像，生成中间过渡视频，提升视频连贯性与创意自由度
高质量视频生成：基于 Wan2.2 架构，输出影视级质量视频
多分辨率支持：支持生成512×512、768×768、1024×1024等分辨率的视频，适配不同场景需求

Wan2.2 Fun InP 开源模型版本概览

模型类型	模型名称	参数量	主要功能	模型仓库
首尾帧控制	Wan2.2-Fun-A14B-InP	14B	支持输入首帧和尾帧图像，生成中间过渡视频，为创作者带来更强的创意控制力	🤗 Wan2.2-Fun-A14B-InP
视频控制	Wan2.2-Fun-A14B-Control	14B	支持不同的控制条件，如Canny、Depth、Pose、MLSD等，同时支持使用轨迹控制	🤗 Wan2.2-Fun-A14B-Control

官方学习资源

Wan2.2 Fun InP ComfyUI 官方原生版本工作流使用指南

版本说明

ComfyUI 官方原生版本由 ComfyOrg 团队提供，使用重新打包的模型文件，确保与 ComfyUI 的最佳兼容性。该版本支持标准模式和 Lightx2v 4步 LoRA 加速模式。

性能对比测试

下面是使用 RTX4090D 24GB 显存 GPU 测试的结果 640*640 分辨率， 81 帧长度的用时对比：

模型类型	分辨率	显存占用	首次生成时长	第二次生成时长
fp8_scaled	640×640	83%	≈ 524秒	≈ 520秒
fp8_scaled + 4步LoRA加速	640×640	89%	≈ 138秒	≈ 79秒

由于使用了加速 LoRA 后提速较为明显，虽然动态有所损失，但对低显存用户较为友好，所以在提供的两组工作流中，默认启用了使用了加速 LoRA 版本，如果你需要启用另一组的工作流，框选后使用 Ctrl+B 即可启用。

1. Wan2.2 Fun InP 首尾帧视频生成 ComfyUI 工作流

工作流获取方式

使用下面的素材作为首尾帧

Wan2.2 Fun Control ComfyUI 工作流起始帧素材

模型文件下载

Diffusion Model

Lightning LoRA (可选，用于加速)

VAE

wan_2.1_vae.safetensors

Text Encoder

umt5_xxl_fp8_e4m3fn_scaled.safetensors

ComfyUI/
├───📂 models/
│   ├───📂 diffusion_models/
│   │   ├─── wan2.2_fun_inpaint_high_noise_14B_fp8_scaled.safetensors
│   │   └─── wan2.2_fun_inpaint_low_noise_14B_fp8_scaled.safetensors
│   ├───📂 loras/
│   │   ├─── wan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensors
│   │   └─── wan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensors
│   ├───📂 text_encoders/
│   │   └─── umt5_xxl_fp8_e4m3fn_scaled.safetensors 
│   └───📂 vae/
│       └── wan_2.1_vae.safetensors

操作步骤详解

步骤图

💡

这个工作流是使用了 LoRA 的工作流，请确保对应的 Diffusion model 和 LoRA 是一致的

High noise 模型及 LoRA 加载

确保 Load Diffusion Model 节点加载了 wan2.2_fun_inpaint_high_noise_14B_fp8_scaled.safetensors 模型
确保 LoraLoaderModelOnly 节点加载了 wan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensors

Low noise 模型及 LoRA 加载

确保 Load Diffusion Model 节点加载了 wan2.2_fun_inpaint_low_noise_14B_fp8_scaled.safetensors 模型
确保 LoraLoaderModelOnly 节点加载了 wan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensors

确保 Load CLIP 节点加载了 umt5_xxl_fp8_e4m3fn_scaled.safetensors 模型
确保 Load VAE 节点加载了 wan_2.1_vae.safetensors 模型
首尾帧图片上传，分别上传首尾帧图片素材
在 Prompt 组中输入提示词
WanFunInpaintToVideo 节点尺寸和视频长度调整
- 调整 width 和 height 的尺寸，默认为 640, 我们设置了较小的尺寸你可以按需进行修改
- 调整 length, 这里为视频总帧数，当前工作流 fps 为 16, 假设你需要生成一个 5 秒的视频，那么你应该设置 5*16 = 80
点击 Run 按钮，或者使用快捷键 Ctrl(cmd) + Enter(回车) 来执行视频生成

Wan2.2 Fun InP Kijai WanVideoWrapper ComfyUI 工作流

⚠️

此部分内容正在准备中，预计将在近期更新。

这部分教程将介绍使用 Kijai/ComfyUI-WanVideoWrapper 的便捷方式。

Wan2.2 Fun InP GGUF 量化版 ComfyUI 工作流

⚠️