Tencent Hunyuanがオープンソース動画生成モデルを発表

HunyuanVideo-I2Vは130億パラメータのマルチモーダル大規模言語モデルを基に開発された画像変換ツールで、単一画像から5秒間の高解像度動画を生成可能です。開発者向けに事前学習済み重み、LoRAトレーニングコード、マルチプラットフォーム展開ソリューションを含む完全な開発キットを提供しています。

現在モデルはhuggingfaceでダウンロード可能です

コア機能デモンストレーション

基本動画生成デモ

カスタムエフェクト事例

エフェクトタイプ	参照画像	生成結果
髪の成長
抱擁アクション

主要機能特徴

インテリジェント動画生成

単一画像入力で5秒間のHD動画生成（2K解像度対応）
3つの制御モード：
- テキスト記述：“主体+動作”コマンドによる制御（例：“アスリートの飛び込み+スローモーション”）
- オーディオ同期：10種類の音声スタイルに対応したリップシンク
- プリセットテンプレート：5種類の標準ダンスルーチンを含む

開発者サポート

完全なモデル重み（130億パラメータ）とトレーニングコードを提供
LoRAファインチューニング技術をサポート、コミュニティ作成の900+カスタムモデル
コンシューマー向けGPU対応（最低RTX 3090必要）

実用事例

EC分野
アパレルブランドが商品360度展示動画生成に活用、制作効率60%向上

映像制作
アニメスタジオがAPIによる一括ストーリーボード作成でプロジェクト期間40%短縮

クリエイティブコンテンツ
開発者コミュニティが「万里の長城漢服変身」「バーチャルアイドルダンス」などを創作（事例集を見る）

アクセスとサポート

オンラインデモ：Tencent Hunyuan AI動画公式サイト
オープンソースコード：GitHubリポジトリ
技術文書：ユーザーガイド
企業向けサービス：Tencent Cloud API連携
Tencent Hunyuan動画テキスト生成モデル ComfyUI チュートリアル