바이트댄스, Seaweed-7B 출시: 비용 효율적인 비디오 생성 기반 모델
2025. 04. 14.
VAST AI Research, TripoSF 오픈소스 공개: 3D 생성 기술의 새로운 높이 재정의
글로벌 3D 생성 기술 선도 기업 VAST AI Research가 최근 최신 기반 모델인 TripoSF를 오픈소스로 공개했습니다. 이 혁신적인 기술은 혁신적인 SparseFlex 표현 방식을 핵심으로 하여 고해상도 3D 모델 생성 분야에 새로운 기준을 세웠으며, 최대 1024³ 해상도의 정밀 모델링을 지원하고 개방형 표면과 복잡한 내부 구조를 모두 처리하여 기존 3D 생성 모델 성능을 진정으로 종합적으로 뛰어넘었습니다.
TripoSF 핵심 기술 하이라이트
SparseFlex 표현 방식: 세부 사항 및 복잡한 구조 생성 잠금 해제
TripoSF는 새로운 3D 표현 방법인 SparseFlex를 기반으로 하며, 희소 복셀 구조를 통해 메모리 사용량을 최적화하고 최대 1024³ 해상도의 모델링 정밀도를 지원합니다. 이 기술은 객체 표면 근처에만 복셀 정보를 저장하면 되며, 외부 텍스처(예: 단면 천 구조)를 캡처하면서 내부 세부 사항(좌석 및 조종석 기계 구조와 같은)을 생성할 수 있어, 전통적으로 AI가 생성하던 거친 “반죽 같은” 모델의 시대를 완전히 종식시킵니다.
시야 절두체 인식 훈련 전략: 효율성과 정밀도 모두에서 혁신
실시간 렌더링의 시야 절두체 컬링 기법에서 영감을 얻어, TripoSF는 훈련 중에 카메라 시야 내의 복셀만 활성화하여 계산 오버헤드를 크게 줄입니다. 실험 데이터에 따르면 생성된 모델은 Chamfer Distance(챔퍼 거리)를 82% 감소시키고 F-점수를 88% 향상시켜, 세부 정밀도와 사실감이 업계의 새로운 기준에 도달했습니다.
동적 토폴로지 지원 및 개방형 생태계
TripoSF는 임의의 위상 구조를 기본적으로 지원하며, 개방형 표면(천과 잎과 같은)과 폐쇄형 솔리드를 모두 처리할 수 있으며, 렌더링 손실을 기반으로 한 직접 최적화 프로세스와도 호환됩니다. 오픈소스 콘텐츠에는 VAE 사전 훈련 모델, 추론 코드 및 인터랙티브 데모가 포함되어 있어 개발자가 GitHub 및 HuggingFace 플랫폼을 통해 빠르게 경험할 수 있습니다.
효과 시연






혁신적인 발전: 기존 3D 생성 방법을 초월하는 주요 장점
결과 품질 측면에서 TripoSF는 “모델 품질의 한계”를 재정의합니다:
- 완전한 시각과 내부 구조: 모델이 처음으로 뒷면 세부 사항을 포착할 뿐만 아니라 내부 구조(예: 버스 좌석 및 운전석)를 정확하게 표현할 수 있습니다.
- 개방형 표면 처리: 과거 기술은 옷이나 꽃잎을 생성할 때 두께가 있는 기하학적 구조만 생성할 수 있었지만, TripoSF는 실제 “단면 자산”을 자연스럽게 표현할 수 있습니다.
- 전례 없는 세부 사항의 풍부함: 다양한 모델 유형에서 생성되는 기하학적 세부 사항과 텍스처 정밀도가 전례 없는 수준에 도달합니다.
응용 시나리오 및 산업 영향
- 영화 및 게임 제작: 감독과 디자이너는 텍스트나 스케치를 통해 고충실도의 3D 장면과 캐릭터를 신속하게 생성할 수 있어 창작 주기를 크게 단축합니다.
- 3D 프린팅 및 제조: 복잡한 기계 부품 및 개인화된 제품의 설계 기준이 낮아져 일반인도 “생각하는 대로 얻을 수 있는” 것을 실현할 수 있습니다.
- 학술 연구: 오픈 소스 코드와 모델 가중치는 3D 생성 분야에 새로운 기준을 제공하여 기본 알고리즘의 혁신을 촉진합니다.
참여 경험 및 리소스 링크
기술 요구 사항
- CUDA 호환 GPU (1024³ 해상도에 대해 ≥12GB VRAM)
- PyTorch 2.0+
- 자세한 설치 및 사용 방법은 GitHub 저장소 문서를 참조하십시오.