Google DeepMind, 비디오 생성 모델 Veo 2 공개

4 weeks ago 7

Hacker News 의견

사용자가 "A pelican riding a bicycle along a coastal path overlooking a harbor"라는 프롬프트로 생성한 비디오에 대한 피드백을 공유함. 네 가지 버전 중 두 개는 자전거를 타는 펠리컨, 하나는 도로를 달리는 펠리컨, 하나는 자전거에 앉아 있는 펠리컨, 마지막은 이상한 헬멧을 쓴 펠리컨이었음. Sora보다 더 나은 결과였음
사용자 선호도에서 Sora Turbo를 2:1로 이긴 것은 인상적임. Sora와 비슷한 제한사항이 있지만, 자연스러운 움직임과 물리학을 조금 더 잘 모방하는 것으로 보임. 블로그 게시물에서 4K 해상도까지 확장 가능하고 길이가 몇 분까지 늘어날 수 있다고 설명함
발표에서 제공되는 예시와 훈련 데이터의 유사성에 대한 궁금증을 표현함. 프롬프트의 세부사항이 결과에 얼마나 반영되는지 의문을 가짐. 예를 들어, DJ의 매력적인 존재감과 음악의 힘에 대한 설명이 비디오에 어떤 영향을 미치는지 궁금해함
스케이트보드 비디오가 비현실적이지만 일부 비디오는 매우 그럴듯하게 보임
페이지가 iPad의 Chrome에서 충돌했음을 언급함
Google의 큰 발표 이후 OpenAI가 Sora 프리뷰를 공개하며 Google을 압도했지만, Veo 2가 Sora보다 발전된 것으로 보임
TV 방송국에서 일하는 친구가 이미 공공 광고 프로그램을 위해 이러한 도구를 사용하고 있음
Google이 Youtube에 대한 접근성을 통해 텍스트/이미지에서 비디오로의 전환을 지배할 가능성이 있다고 생각함
Veo 2의 샘플 길이가 8초, VideoGen의 샘플 길이가 10초, 다른 모델의 샘플 길이가 5초인 부분에 혼란스러움을 표현함. Veo 2의 긍정적인 결과가 더 긴 비디오를 선호하는 평가자 때문인지 의문을 가짐
Google의 AI 부서는 OpenAI의 화려한 요트와 비교하여 거대한 핵잠수함과 같다고 비유함. Google이 AGI에 가까워졌을 가능성을 제기하며, Microsoft와 Amazon의 상황도 언급함