VAST AI Research открывает исходный код TripoSF: переопределение новых высот в технологии 3D генерации
Ведущий в области технологии 3D генерации VAST AI Research недавно объявил об открытии исходного кода своей последней базовой модели TripoSF. Эта прорывная технология, центрированная вокруг инновационного представления SparseFlex, устанавливает новый бенчмарк в генерации высокоразрешающих 3D моделей, поддерживая тонкое моделирование с разрешением до 1024³ и обработку как открытых поверхностей, так и сложных внутренних структур, действительно достигая комплексного превосходства над производительностью существующих моделей 3D генерации.
Ключевые технические особенности TripoSF
Представление SparseFlex: разблокировка генерации деталей и сложных структур
TripoSF основан на новом методе 3D представления SparseFlex, который оптимизирует использование памяти через разреженные воксельные структуры, поддерживая точность моделирования с разрешением до 1024³. Эта технология нуждается только в хранении воксельной информации около поверхностей объектов, способна захватывать внешние текстуры (такие как односторонние тканевые структуры), в то время как генерирует внутренние детали (такие как сиденья и механические структуры кабины), полностью заканчивая эру грубых “тестообразных” моделей, традиционно генерируемых ИИ.
Стратегия обучения с осведомленностью о пирамиде видимости: прорыв в эффективности и точности
Черпая вдохновение из техник отсечения пирамиды видимости в рендеринге в реальном времени, TripoSF активирует только воксели в пределах вида камеры во время обучения, значительно снижая вычислительные накладные расходы. Экспериментальные данные показывают, что его сгенерированные модели достигают 82% снижения в расстоянии Chamfer и 88% улучшения в F-score, с точностью деталей и реалистичностью, достигающими новых промышленных бенчмарков.
Поддержка динамической топологии и открытая экосистема
TripoSF нативно поддерживает произвольные топологические структуры, способен обрабатывать открытые поверхности (такие как ткани и листья) и закрытые твердые тела, в то время как совместим с процессами прямой оптимизации, основанными на потерях рендеринга. Открытый контент включает VAE предварительно обученные модели, код вывода и интерактивные демонстрации, позволяя разработчикам быстро испытать его через платформы GitHub и HuggingFace.
Демонстрация эффектов






Прорывная инновация: ключевые преимущества за пределами существующих методов 3D генерации
С точки зрения качества результатов, TripoSF переопределяет “верхний предел качества модели”:
- Полный вид и внутренняя структура: Впервые модели могут не только захватывать детали задней стороны, но и точно представлять внутренние структуры (такие как сиденья автобуса и кабины водителя)
- Обработка открытых поверхностей: В то время как прошлые технологии могли создавать только геометрические структуры с толщиной при генерации одежды или лепестков, TripoSF может естественно представлять реальные “односторонние активы”
- Небывалое богатство деталей: По различным типам моделей геометрические детали и точность текстур, которые он генерирует, достигают небывалых уровней
Сценарии применения и промышленное влияние
- Кинопроизводство и разработка игр: Режиссеры и дизайнеры могут быстро генерировать высококачественные 3D сцены и персонажей через текст или эскизы, значительно сокращая творческий цикл
- 3D печать и производство: Порог дизайна для сложных механических частей и персонализированных продуктов снижен, позволяя обычным людям реализовать “что думаешь, то и получаешь”
- Академические исследования: Открытый исходный код и веса моделей предоставляют новые бенчмарки для области 3D генерации, продвигая инновации в базовых алгоритмах
Опыт участия и ссылки на ресурсы
Технические требования
- CUDA совместимый GPU (≥12GB VRAM для разрешения 1024³)
- PyTorch 2.0+
- Пожалуйста, обратитесь к документации репозитория GitHub для подробных методов установки и использования