Lightricks 发布实时视频生成模型 LTX-Video
Lightricks 公司近日发布了一个突破性的 AI 视频生成模型 LTX-Video。这是首个基于 DiT (Diffusion Transformers) 的实时视频生成模型,能够以超过播放速度的速率生成高质量视频。
主要特点
- 实时生成: 可以生成 24FPS、768x512 分辨率的视频,生成速度快于播放速度
- 支持文本生成视频和图像生成视频两种模式
- 基于大规模视频数据集训练,生成内容真实自然
- 开源实现,支持本地部署和 ComfyUI 集成
技术细节
该模型支持以下功能:
- 分辨率需要是 32 的倍数
- 帧数需要是 8n+1 (如 257 帧)
- 最佳工作分辨率在 720x1280 以下
- 帧数建议在 257 帧以下
- 支持详细的英文提示词描述
开源与部署
LTX-Video 已在 GitHub 和 Hugging Face 开源发布:
开发可以通过以下方式使用:
- 在线 Demo
- ComfyUI 插件
- 本地部署
这一突破性的实时视频生成技术,将为创意工作者和内容创作带来新的可能。无论是电影预览、广告制作还是社交媒体内容创作,都可以通过 LTX-Video 实现快速的视频创意表达。