Tencentが画像から動画を生成するオープンソースモデルHunyuanVideo-I2Vを公開

news

TencentのHunyuanチームが単一画像から5秒動画を生成可能なオープンソースモデルをリリース。スマートモーション生成とカスタムエフェクト機能を提供

HunyuanVideo-I2Vは130億パラメータのマルチモーダル大規模言語モデルを基に開発された画像変換ツールで、単一画像から5秒間の高解像度動画を生成可能です。開発者向けに事前学習済み重み、LoRAトレーニングコード、マルチプラットフォーム展開ソリューションを含む完全な開発キットを提供しています。

モデルアーキテクチャ図

現在モデルはhuggingfaceでダウンロード可能です

コア機能デモンストレーション

基本動画生成デモ

お使いのブラウザはビデオタグをサポートしていません

カスタムエフェクト事例

| エフェクトタイプ | 参照画像 | 生成結果 | |

|

-|

-| | 髪の成長 | 参照画像 | | | 抱擁アクション | 参照画像 | |

主要機能特徴

インテリジェント動画生成

  • 単一画像入力で5秒間のHD動画生成(2K解像度対応)
  • 3つの制御モード:
    • テキスト記述:"主体+動作"コマンドによる制御(例:"アスリートの飛び込み+スローモーション")
    • オーディオ同期:10種類の音声スタイルに対応したリップシンク
    • プリセットテンプレート:5種類の標準ダンスルーチンを含む

開発者サポート

  • 完全なモデル重み(130億パラメータ)とトレーニングコードを提供
  • LoRAファインチューニング技術をサポート、コミュニティ作成の900+カスタムモデル
  • コンシューマー向けGPU対応(最低RTX 3090必要)

実用事例

EC分野
アパレルブランドが商品360度展示動画生成に活用、制作効率60%向上

映像制作
アニメスタジオがAPIによる一括ストーリーボード作成でプロジェクト期間40%短縮

クリエイティブコンテンツ
開発者コミュニティが「万里の長城漢服変身」「バーチャルアイドルダンス」などを創作(事例集を見る

アクセスとサポート

Tencentが画像から動画を生成するオープンソースモデルHunyuanVideo-I2Vを公開 | ComfyUI Wiki