崑崙万維がSkyReels-V2無限長映画生成モデルをリリース
2025/04/21
テンセント混元とInstantXチームがInstantCharacterオープンソースプロジェクトをリリース
テンセント混元(Hunyuan)とInstantXチームは共同でInstantCharacterオープンソースプロジェクトをリリースしました。これは、1枚の画像からキャラクターの一貫性を保った生成を実現するチューニング不要の手法で、さまざまな下流タスクをサポートしています。このプロジェクトは「1枚の画像+1つの文章」という簡単なアプローチで、異なるシーンでもキャラクターの一貫性を保った画像生成を可能にします。
主な機能
シーンを超えたキャラクターの一貫性
InstantCharacterは、参照画像とテキスト記述に基づいて、異なるシーン(キッチン、都市など)、異なるアクション(走る、話すなど)、そして異なる視点でもキャラクターの外観特性の高い一貫性を維持できます。ユーザーはキャラクター画像を1枚入力し、テキスト指示を調整するだけで、さまざまな環境でのキャラクターの一貫した画像を生成できます。
柔軟な制御と編集能力
- ポーズとシーンの分離:キャラクターのアクションと背景環境を独立して調整可能
- マルチスタイル対応:リアル、漫画、サイバーパンクなど様々な芸術スタイルに対応
- テキスト駆動の生成:プロンプトを修正するだけで生成効果を素早く切り替え可能
効率的な生成アーキテクチャ
このプロジェクトは軽量技術を採用し、最小限のパラメータ調整でスタイル転送を実現し、計算リソースの消費を大幅に削減して生成効率を向上させています。
技術革新
InstantCharacterは、Diffusion Transformerを使用して生成フレームワークを構築し、従来のU-Netアーキテクチャの限界を打破しています。このフレームワークは、オープンドメインのキャラクター特徴を処理するためのスケーラブルなアダプターモジュールを導入し、拡散モデルの潜在空間とシームレスに相互作用することで、モデルの汎化能力と画像精度を効果的に高めています。
このプロジェクトは、数千万のサンプルを含む大規模データセットでトレーニングされ、ペアデータによるアイデンティティの一貫性の最適化と、非ペアデータによるテキスト編集可能性の強化を通じて、独自のデュアルパス最適化戦略を形成しています。
応用シナリオ
InstantCharacterは複数の分野で幅広い応用展望があります:
- 映画・アニメーション:絵コンテやコンセプトデザインを迅速に生成し、キャラクターモデリングのサイクルを短縮
- ゲーム開発:新しいストーリーシーンなど、IPの派生キャラクター拡張コンテンツを容易に作成
- 漫画制作:複数コマの漫画キャラクターの動的シーケンスを効率的に生成
- 個人創作:専門的なモデリング経験なしに、ソーシャルメディアのカスタマイズ画像を迅速に作成
オープンソースエコシステムとリソース
InstantCharacterはFluxなどのオープンソーステキスト画像生成モデルをサポートし、開発者が拡張できるプラグインツールを提供しています。関連リソース:
- 公式ウェブサイトとコードリポジトリ:https://github.com/Tencent/InstantCharacter
- Hugging Faceオンライン体験:https://huggingface.co/spaces/InstantX/InstantCharacter
- プロジェクトホームページ:https://instantcharacter.github.io/