AIGC 최신 뉴스
최신 AIGC 뉴스와 업데이트를 확인하세요.
바이트댄스, LatentSync 오픈소스 공개 - 확산 모델 기반 고정밀 립싱크 기술
바이트댄스가 오픈소스 립싱크 도구 LatentSync를 공개했습니다. 오디오 조건부 잠재 공간 확산 모델을 기반으로 실제 인물과 애니메이션 캐릭터의 정확한 립싱크를 구현하고 기존 방식의 프레임 지터 문제를 해결했습니다
VMix: 바이트댄스가 선보인 혁신적인 텍스트-이미지 생성 모델의 미학적 향상 기술
바이트댄스와 중국과학기술대학이 공동으로 VMix 어댑터를 출시하여 교차 주의력 혼합 제어 기술을 통해 AI 생성 이미지의 미학적 품질을 향상시키고, 재학습 없이도 기존 모델과 완벽하게 통합
텐센트, StereoCrafter 오픈소스 공개: 일반 동영상을 3D 동영상으로 원클릭 변환
텐센트 AI Lab과 ARC Lab이 공동 개발한 StereoCrafter 모델이 오픈소스로 공개되었습니다. 이 모델은 모든 2D 동영상을 고품질 입체 3D 동영상으로 변환할 수 있으며, Apple Vision Pro를 포함한 다양한 3D 디스플레이 장치를 지원합니다.
LuminaBrush: ControlNet 제작자가 출시한 AI 조명 편집 도구
ControlNet과 IC-Light 제작자 lllyasviel이 새로운 LuminaBrush를 출시했습니다. 2단계 프레임워크를 통해 정밀한 조명 효과 제어를 구현하고 직관적인 브러시 상호작용 경험을 제공합니다
Genesis: 혁신적인 범용 물리 엔진과 생성형 AI 플랫폼 출시
Genesis 프로젝트가 물리 시뮬레이션, 로봇 제어, 생성형 AI 기능을 통합한 새로운 범용 물리 엔진과 생성형 AI 플랫폼을 출시하여 로봇과 물리 AI 애플리케이션을 위한 종합 솔루션 제공
Odyssey, Explorer 출시 - 혁신적인 생성형 월드 모델
Odyssey가 2D 이미지를 완전한 3D 세계로 변환할 수 있는 최초의 생성형 월드 모델 Explorer를 출시하여 동적 효과와 주류 창작 도구 편집을 지원하며, 영화, 게임 등 분야에 혁명적인 변화를 가져올 예정입니다
ComfyUI Impact-Pack 플러그인에서 채굴 바이러스 발견 - 긴급 조치 필요
ComfyUI 커뮤니티의 인기 플러그인 Impact-Pack이 Ultralytics 패키지를 통해 채굴 멀웨어를 포함하고 있는 것으로 발견되어 많은 사용자에게 영향을 미치고 있습니다. 이 글에서는 바이러스 상황과 해결책을 자세히 설명합니다.
Luma, 혁신적인 AI 이미지 생성 모델 Photon 출시
Luma가 혁신적인 Photon과 Photon Flash 이미지 생성 모델을 출시하여 뛰어난 가성비와 우수한 이미지 품질로 AI 창작 분야를 재정의
텐센트, HunyuanVideo 동영상 생성 대규모 모델 오픈소스 공개 - 동영상 생성의 새로운 시대를 열다
텐센트가 업계 최대 규모의 동영상 생성 대규모 모델 HunyuanVideo를 공식 오픈소스로 공개했습니다. 130억 개의 매개변수를 보유하고 있으며, 동영상 품질과 동작 안정성 등에서 선도적인 수준을 달성했습니다
Stability AI, Stable Diffusion 3.5 Large ControlNet 모델 출시
Stability AI가 Stable Diffusion 3.5 Large를 위한 세 가지 새로운 ControlNet 모델을 출시했습니다. Blur, Canny, Depth를 포함하여 이미지 생성에 대한 더 정밀한 제어 기능을 제공합니다
NVIDIA Edify 3D 출시 - 혁신적인 3D 자산 생성 기술
NVIDIA는 새로운 Edify 3D 기술을 출시하여, 2분 만에 고품질의 3D 자산을 생성할 수 있습니다. 이 기술은 상세한 기하학, 명확한 토폴로지, 고해상도 텍스처 및 PBR 재료를 포함합니다.
Lightricks, 실시간 비디오 생성 모델 LTX-Video 출시
Lightricks는 DiT 기반의 실시간 비디오 생성 모델 LTX-Video를 출시하였으며, 고품질 비디오의 실시간 생성을 지원하며 GitHub와 Hugging Face에서 오픈 소스로 제공됩니다.
InstantX, FLUX.1-dev IP-Adapter 모델 출시
InstantX 팀이 FLUX.1-dev 기반의 IP-Adapter 모델을 출시하여 FLUX 모델에 더 강력한 이미지 참조 기능을 제공
FLUX 공식 도구 모음 출시
Black Forest Labs는 로컬 리드로우, ControlNet, 이미지 스타일 변환을 포함한 다양한 FLUX 공식 도구를 출시합니다
IC-Light V2 출시: 향상된 이미지 편집 기능
IC-Light V2는 Flux 기반의 이미지 편집 모델로, 유화 및 애니메이션 스타일을 포함한 다양한 스타일화된 이미지 처리를 지원합니다. 이 문서는 IC-Light V2의 새로운 기능과 응용에 대해 설명합니다.
Stable Diffusion 3.5 출시: AI 이미지 생성의 새로운 시대
Stability AI가 Stable Diffusion 3.5를 출시하여 다양한 강력한 모델 변형을 제공하고, 상업적 사용을 지원하며, 이미지 품질과 프롬프트 준수에서 시장을 선도합니다.
ComfyUI V1 출시: 원클릭 설치가 가능한 크로스 플랫폼 데스크탑 앱
ComfyUI가 버전 1을 출시하여 원클릭 설치가 가능한 크로스 플랫폼 데스크탑 애플리케이션과 새롭게 디자인된 사용자 인터페이스, 다양한 기능 개선을 통해 사용자 경험을 크게 향상시켰습니다.
Kuaishou와 PKU, 피라미드 플로우 매칭 비디오 생성 모델 공동 출시
Kuaishou Technology와 Peking University가 공동으로 개발한 피라미드 플로우 매칭 모델은 플로우 매칭 기반의 자기회귀 비디오 생성 기술로, 고품질의 장시간 비디오 콘텐츠를 생성할 수 있습니다.
Jasperai, Flux.1-dev ControlNet 모델 시리즈 출시
Jasperai는 Flux.1-dev를 위한 ControlNet 모델 시리즈를 소개하며, 표면 법선, 깊이 맵, 초해상도 모델을 포함하여 AI 이미지 생성에 대한 더 정밀한 제어를 제공합니다.
ComfyUI-PuLID-Flux: ComfyUI에서 PuLID-Flux 구현하기
ComfyUI-PuLID-Flux는 PuLID-Flux를 ComfyUI에 통합하여 강력한 이미지 생성 및 편집 기능을 제공하는 오픈 소스 프로젝트입니다.
Meta, Movie Gen 소개: 비디오 및 오디오 생성 AI 모델
Meta는 비디오 생성, 오디오 생성 및 개인화된 비디오 편집 기능을 포함한 Movie Gen 시리즈 모델을 소개하여 AI 콘텐츠 생성의 새로운 지평을 열었습니다.
ostris, OpenFLUX.1 출시: FLUX.1-schnell의 상업적으로 사용 가능한 디-디스틸드 버전
ostris는 FLUX.1-schnell 모델의 디-디스틸드 버전인 OpenFLUX.1을 출시했으며, 이는 미세 조정이 가능하고, 일반적인 CFG 값을 사용하며, 상업적 라이선스를 유지합니다.
Black Forest Lab, FLUX 1.1 [Pro] 출시
Black Forest Labs는 초고속 생성, 우수한 이미지 품질, 2K 초고해상도 생성을 특징으로 하는 생성 AI 모델 FLUX1.1 [pro]를 소개하여 창작자, 개발자 및 기업에 전례 없는 기회를 제공합니다.
THUDM, 새로운 이미지 생성 모델 오픈 소스화: CogView3 및 CogView-3Plus
THUDM은 최신 이미지 생성 모델 CogView3 및 CogView-3Plus-3B를 오픈 소스화하여 뛰어난 성능과 효율성을 선보였습니다. CogView3는 계단식 확산 기술을 활용하며, CogView-3Plus-3B는 DiT 아키텍처 기반의 경량 모델로, 텍스트-이미지 생성 분야에 중요한 돌파구를 제공합니다.