- Google DeepMind가 Veo 3와 Imagen 4, Flow를 공개하며 영상·이미지·영화 제작 도구를 혁신적으로 확장함
- Veo 3는 오디오 포함 동영상 생성, 실제 물리 반영, 입술 동기화 등의 성능을 제공함
- Imagen 4는 정교한 디테일 묘사와 타이포그래피 처리 능력 향상으로 출력물 제작에 유리함
- Flow는 다양한 모델을 통합해 자연어 기반 영화 제작을 가능케 하는 새로운 창작 도구임
- 모든 생성 콘텐츠에는 SynthID 워터마크가 삽입되며, 감지 도구도 함께 출시되어 투명성을 강화함
새로운 생성형 미디어 모델 및 도구로 창작력을 발휘하세요
- Google은 최신 생성형 미디어 모델인 Veo 3, Imagen 4, 그리고 새로운 영화 제작 도구 Flow를 발표함
- 이들 모델은 이미지, 동영상, 음악을 생성하며, 창작자가 상상한 세계를 실현하는 데 도움을 줌
- Google DeepMind는 영상 제작자, 음악가, 예술가들과 협력하여 도구를 공동 설계했으며 책임감 있는 AI 사용을 강조함
Veo 3: 오디오를 포함한 고급 비디오 생성
- Veo 3는 Veo 2보다 향상된 품질의 동영상을 생성하며, 처음으로 배경음, 대사 등 오디오를 포함한 영상 생성이 가능함
-
텍스트나 이미지 기반 프롬프트를 통해 실제같은 물리 기반 영상 제작이 가능하고 입술 동기화도 정확함
- Gemini 앱과 Flow, Vertex AI를 통해 미국에서 Ultra 요금제 사용자에게 제공 중임
Veo 2: 창작자 피드백 기반 기능 추가
Flow: Veo에 최적화된 AI 영화 제작 도구
- Flow는 Veo, Imagen, Gemini를 통합하여 자연어 기반으로 장면, 캐릭터, 스타일 등을 설정하고 영상으로 구현 가능
- 미국의 AI Pro 및 Ultra 요금제 사용자에게 제공되며, 점차 다른 국가로 확대 예정임
Imagen 4: 해상도, 디테일, 타이포그래피 향상
- Imagen 4는 세밀한 텍스처 묘사, 포토리얼리스틱 및 추상적 스타일 지원, 2K 해상도 출력을 제공함
- 타이포그래피 기능도 향상되어 카드, 포스터, 만화 제작에 유리함
- Gemini 앱, Vertex AI, Slides, Docs, Whisk 등에서 사용 가능하며, 최대 10배 빠른 버전도 곧 출시 예정임
Lyria 2: 인터랙티브 음악 생성
- 음악가를 위한 Music AI Sandbox에 포함된 모델로, 창작 실험을 지원하고 새로운 음악 탐색을 가능하게 함
- YouTube Shorts, Vertex AI, MusicFX DJ 등에서 사용 가능하며, API 및 AI Studio를 통한 실시간 인터랙션도 제공함
SynthID로 AI 생성 콘텐츠 식별 가능
- 2023년부터 시작된 SynthID는 이미지, 영상, 오디오, 텍스트 등 100억 건 이상의 AI 생성 콘텐츠에 워터마크 삽입
- 새롭게 출시된 SynthID Detector를 통해 사용자도 생성 여부를 판별 가능
- Google은 생성형 AI가 창작을 돕는 방향으로 활용되도록 책임 있는 도구 설계와 공개 협력을 지속하고 있음