Google DeepMind, 비디오 생성 모델 Veo 2 공개

4 weeks ago 7

Hacker News 의견
  • 사용자가 "A pelican riding a bicycle along a coastal path overlooking a harbor"라는 프롬프트로 생성한 비디오에 대한 피드백을 공유함. 네 가지 버전 중 두 개는 자전거를 타는 펠리컨, 하나는 도로를 달리는 펠리컨, 하나는 자전거에 앉아 있는 펠리컨, 마지막은 이상한 헬멧을 쓴 펠리컨이었음. Sora보다 더 나은 결과였음

  • 사용자 선호도에서 Sora Turbo를 2:1로 이긴 것은 인상적임. Sora와 비슷한 제한사항이 있지만, 자연스러운 움직임과 물리학을 조금 더 잘 모방하는 것으로 보임. 블로그 게시물에서 4K 해상도까지 확장 가능하고 길이가 몇 분까지 늘어날 수 있다고 설명함

  • 발표에서 제공되는 예시와 훈련 데이터의 유사성에 대한 궁금증을 표현함. 프롬프트의 세부사항이 결과에 얼마나 반영되는지 의문을 가짐. 예를 들어, DJ의 매력적인 존재감과 음악의 힘에 대한 설명이 비디오에 어떤 영향을 미치는지 궁금해함

  • 스케이트보드 비디오가 비현실적이지만 일부 비디오는 매우 그럴듯하게 보임

  • 페이지가 iPad의 Chrome에서 충돌했음을 언급함

  • Google의 큰 발표 이후 OpenAI가 Sora 프리뷰를 공개하며 Google을 압도했지만, Veo 2가 Sora보다 발전된 것으로 보임

  • TV 방송국에서 일하는 친구가 이미 공공 광고 프로그램을 위해 이러한 도구를 사용하고 있음

  • Google이 Youtube에 대한 접근성을 통해 텍스트/이미지에서 비디오로의 전환을 지배할 가능성이 있다고 생각함

  • Veo 2의 샘플 길이가 8초, VideoGen의 샘플 길이가 10초, 다른 모델의 샘플 길이가 5초인 부분에 혼란스러움을 표현함. Veo 2의 긍정적인 결과가 더 긴 비디오를 선호하는 평가자 때문인지 의문을 가짐

  • Google의 AI 부서는 OpenAI의 화려한 요트와 비교하여 거대한 핵잠수함과 같다고 비유함. Google이 AGI에 가까워졌을 가능성을 제기하며, Microsoft와 Amazon의 상황도 언급함

Read Entire Article