구글, Veo 3와 Imagen 4, 그리고 영화 제작을 위한 새로운 도구 Flow 공개

3 days ago 10

Google DeepMind가 Veo 3와 Imagen 4, Flow를 공개하며 영상·이미지·영화 제작 도구를 혁신적으로 확장함
Veo 3는 오디오 포함 동영상 생성, 실제 물리 반영, 입술 동기화 등의 성능을 제공함
Imagen 4는 정교한 디테일 묘사와 타이포그래피 처리 능력 향상으로 출력물 제작에 유리함
Flow는 다양한 모델을 통합해 자연어 기반 영화 제작을 가능케 하는 새로운 창작 도구임
모든 생성 콘텐츠에는 SynthID 워터마크가 삽입되며, 감지 도구도 함께 출시되어 투명성을 강화함

새로운 생성형 미디어 모델 및 도구로 창작력을 발휘하세요

Google은 최신 생성형 미디어 모델인 Veo 3, Imagen 4, 그리고 새로운 영화 제작 도구 Flow를 발표함
이들 모델은 이미지, 동영상, 음악을 생성하며, 창작자가 상상한 세계를 실현하는 데 도움을 줌
Google DeepMind는 영상 제작자, 음악가, 예술가들과 협력하여 도구를 공동 설계했으며 책임감 있는 AI 사용을 강조함

Veo 3: 오디오를 포함한 고급 비디오 생성

Veo 3는 Veo 2보다 향상된 품질의 동영상을 생성하며, 처음으로 배경음, 대사 등 오디오를 포함한 영상 생성이 가능함
텍스트나 이미지 기반 프롬프트를 통해 실제같은 물리 기반 영상 제작이 가능하고 입술 동기화도 정확함
Gemini 앱과 Flow, Vertex AI를 통해 미국에서 Ultra 요금제 사용자에게 제공 중임

Veo 2: 창작자 피드백 기반 기능 추가

Veo 2에는 창작자들의 피드백을 바탕으로 다음과 같은 기능이 추가됨:
- 레퍼런스 기반 영상 생성: 캐릭터, 스타일, 오브젝트 등을 이미지로 입력해 일관성 있는 영상 생성 가능
- 카메라 컨트롤: 회전, 줌, 돌리 등 카메라 움직임 설정 가능
- Outpainting: 프레임 확장으로 세로에서 가로 전환 및 장면 자연 확장 가능
- 오브젝트 추가 및 제거: 객체의 크기·그림자·상호작용까지 반영하여 자연스럽게 편집 가능
이 기능들은 Flow에서 사용 가능하며, Vertex AI API에 순차 적용될 예정임

Flow: Veo에 최적화된 AI 영화 제작 도구

Flow는 Veo, Imagen, Gemini를 통합하여 자연어 기반으로 장면, 캐릭터, 스타일 등을 설정하고 영상으로 구현 가능
미국의 AI Pro 및 Ultra 요금제 사용자에게 제공되며, 점차 다른 국가로 확대 예정임

Imagen 4: 해상도, 디테일, 타이포그래피 향상

Imagen 4는 세밀한 텍스처 묘사, 포토리얼리스틱 및 추상적 스타일 지원, 2K 해상도 출력을 제공함
타이포그래피 기능도 향상되어 카드, 포스터, 만화 제작에 유리함
Gemini 앱, Vertex AI, Slides, Docs, Whisk 등에서 사용 가능하며, 최대 10배 빠른 버전도 곧 출시 예정임

Lyria 2: 인터랙티브 음악 생성

음악가를 위한 Music AI Sandbox에 포함된 모델로, 창작 실험을 지원하고 새로운 음악 탐색을 가능하게 함
YouTube Shorts, Vertex AI, MusicFX DJ 등에서 사용 가능하며, API 및 AI Studio를 통한 실시간 인터랙션도 제공함

SynthID로 AI 생성 콘텐츠 식별 가능

2023년부터 시작된 SynthID는 이미지, 영상, 오디오, 텍스트 등 100억 건 이상의 AI 생성 콘텐츠에 워터마크 삽입
새롭게 출시된 SynthID Detector를 통해 사용자도 생성 여부를 판별 가능
Google은 생성형 AI가 창작을 돕는 방향으로 활용되도록 책임 있는 도구 설계와 공개 협력을 지속하고 있음

Read Entire Article