Skip to content
ComfyUI 教程ComfyUI 进阶教程4. LTX 视频生成教程

LTX Video 工作流程详细教程

LTX Video Workflow

LTX Video 模型介绍

LTX Video 是一个仅有 2B 参数的 DiT 架构视频生成模型,具有以下特点:

  • 实时生成:能以超过实时播放速度生成视频
  • 高质量输出:768x512 分辨率,24FPS 的流畅视频
  • 多种生成模式:支持文本到视频、图像到视频、视频到视频转换

环境准备

系统要求

  • Python 3.10.5 或更高版本
  • CUDA 12.2 或更高版本
  • PyTorch >= 2.1.2

ComfyUI 环境

  1. 更新 ComfyUI 首先确保你的 ComfyUI 已更新到最新版本,如果你不知道如何更新和升级 ComfyUI 请参考如何更新和升级 ComfyUI

  2. 安装 ComfyUI-LTXVideo 插件 有两种安装方式:

方式一:通过 ComfyUI Manager (推荐)

  1. 打开 ComfyUI Manager
  2. 搜索 “LTXVideo”
  3. 点击安装

方式二:手动安装

  1. 进入 ComfyUI 的 custom_nodes 目录
  2. 克隆仓库:
git clone https://github.com/Lightricks/ComfyUI-LTXVideo
  1. 安装依赖:
pip install -r requirements.txt

如果你不太熟悉插件安装相关操作,可以参考ComfyUI 插件安装教程

LTX Video 模型及相关模型下载

你需要下载以下模型文件:

模型名称文件名安装位置下载链接
LTX Video 模型ltx-video-2b-v0.9.safetensorsmodels/checkpointsHugging Face
PixArt 文本编码器model-00001-of-00002.safetensorsmodels/text_encoders/PixArt-XL-2-1024-MS/text_encoderHugging Face
T5 文本编码器t5xxl_fp16.safetensorsmodels/text_encodersHugging Face

注意:

  1. PixArt 文本编码器需要下载完整的 text_encoder 文件夹内容
  2. T5 文本编码器文件较大(约9.79GB),建议使用下载工具下载

LTX Video 工作流文件

文本到视频工作流

LTX Video 文本到视频工作流

图像到视频工作流

LTX Video 图像到视频工作流

视频到视频工作流

LTX Video 视频到视频工作流

LTX Video 使用限制说明

分辨率和帧数

  • 分辨率必须是32的倍数
  • 帧数必须是8的倍数+1(如65帧、257帧等)
  • 建议分辨率不超过720x1280
  • 建议帧数不超过257帧

提示词规范

  • 必须使用英文
  • 提示词越详细越好
  • 建议包含场景、动作、细节等完整描述

工作流使用教程

基础节点说明

所有工作流都包含以下基础节点:

  1. 模型加载节点
  • LTXVLoader: 加载 LTX Video 主模型
    • 选择 ltx-video-2b-v0.9.safetensors 文件
  • LTXVCLIPModelLoader: 加载文本编码器
    • 选择 PixArt-XL-2-1024-MS/text_encoder/model-00001-of-00002.safetensors 文件
  • LTXVModelConfigurator: 配置模型参数
    • 设置分辨率、帧数、FPS等基本参数
    • 可选择是否启用 conditioning 输入
  1. 提示词处理节点
  • CLIPTextEncode (Positive): 正向提示词编码
    • 使用 PixArt 编码器处理正向提示词
  • CLIPTextEncode (Negative): 负向提示词编码
    • 使用 PixArt 编码器处理负向提示词
  • CFGGuider: 控制提示词引导强度
    • 建议值范围: 2-7
    • 数值越大,生成内容越接近提示词描述
  1. 采样控制节点
  • KSamplerSelect: 选择采样器
    • 推荐使用 euler 采样器
  • BasicScheduler: 设置采样步数和调度器
    • 步数范围: 10-25
    • 调度器类型: normal
  • RandomNoise: 生成随机噪声
    • 可设置固定种子以获得可重复的结果
  • SamplerCustomAdvanced: 执行采样过程
    • 整合所有采样相关参数进行最终生成
  1. 输出节点
  • VAEDecode: 解码生成的帧
    • 使用 LTX Video 内置的 VAE 解码器
  • VHS_VideoCombine: 合成最终视频
    • 可设置输出视频的帧率、格式、编码参数
    • 支持预览生成的视频

LTX Video 生成模式教程

文本到视频 (Text-to-Video)

  1. 设置基本参数LTXVModelConfigurator 中:
  • 分辨率: 768x512
  • 帧数: 65 (约2.5秒)
  • FPS: 25
  1. 编写提示词
  • 正向提示词要尽可能详细,描述场景、动作和细节
  • 负向提示词建议包含: “worst quality, inconsistent motion, blurry, jittery, distorted, watermarks”
  1. 调整采样参数
  • Steps: 建议 20 步
  • CFG: 建议 4-7
  • Sampler: euler
  • Scheduler: normal

图像到视频 (Image-to-Video)

除了基本设置外,还需要:

  1. 准备参考图像
  • 使用 LoadImage 节点加载参考图像
  • 图像最好符合目标分辨率比例
  1. 调整转换参数
  • 降低 CFG 值(建议 3-5)以保持与参考图像的一致性
  • 可以适当减少采样步数(15-20)

视频到视频 (Video-to-Video)

  1. 加载源视频 使用 VHS_LoadVideo 节点:
  • 设置适当的帧率
  • 选择是否需要调整分辨率
  1. 参数调优
  • 使用较低的 CFG (2-4)
  • 减少采样步数(10-15)
  • 适当调整 sigma_shift 参数

LTX Video 优化指南

参数优化

  1. 提示词优化

    • 使用详细、具体的描述
    • 包含动作、场景转换的描述
    • 添加镜头语言相关的词汇
  2. 性能优化

    • 适当降低分辨率提升速度
    • 减少帧数进行测试
    • 使用较少的采样步数
  3. 质量优化

    • 画面抖动:降低 CFG 值
    • 细节不足:增加采样步数
    • 转场不自然:优化提示词描述

LTX Video 高级应用技巧

长视频制作

  • 使用多个片段分别生成
  • 通过提示词保持风格一致性
  • 使用视频编辑工具进行后期衔接

风格控制

  • 在提示词中加入具体的艺术风格描述
  • 使用参考图像引导风格
  • 通过 CFG 值调整风格强度

动作控制

  • 在提示词中详细描述动作过程
  • 使用关键帧作为参考
  • 适当调整帧率以获得理想效果

LTX Video 示例与模板

场景示例

  1. 简单场景过渡

正向提示词: “A serene lake at sunrise, gentle ripples on the water surface, morning mist slowly rising, birds flying across the golden sky” 采样步数: 20 CFG: 4

  1. 复杂动作序列 正向提示词: “A professional dancer performing a graceful contemporary dance sequence, flowing movements, dynamic spins and leaps, soft lighting, studio setting” 采样步数: 25 CFG: 5

记得保存你满意的参数组合,以便后续使用。通过不断实验和调整,你会逐渐掌握 LTX Video 的使用技巧。

LTX Video 提示词模板

The turquoise waves crash against the dark, jagged rocks of the shore, sending white foam spraying into the air. The scene is dominated by the stark contrast between the bright blue water and the dark, almost black rocks. The water is a clear, turquoise color, and the waves are capped with white foam. The rocks are dark and jagged, and they are covered in patches of green moss. The shore is lined with lush green vegetation, including trees and bushes. In the background, there are rolling hills covered in dense forest. The sky is cloudy, and the light is dim.

LTX Video 资源链接

LTX Video 官方资源

LTX Video 模型下载

LTX Video 在线服务

LTX Video 社区资源

支持与帮助