모델에서 직접 라이브 스트리밍되는 웹사이트

3 days ago 9

실시간 온디맨드 생성으로 모든 페이지를 이미지로 만들고, 이미지 안의 대상을 클릭하면 더 깊게 탐색하는 새 화면이 생성됨
화면에는 HTML이나 입력 필드가 없고, 텍스트까지 이미지 모델이 픽셀로 직접 렌더링하는 픽셀 중심 인터페이스로 동작함
페이지 정보는 agentic web search와 이미지 모델의 세계 지식을 함께 사용해 만들며, 정확도는 ChatGPT, Gemini, Claude에서 기대하는 수준과 비슷하다고 적혀 있음
live video stream 기능은 탐색 이미지를 애니메이션화하고 전환을 매끄럽게 만들지만, 현재는 예측이 어렵고 자원 소모가 커서 토글 뒤에 숨겨져 있음
지금은 실험적 탐색·학습 도구에 가깝지만, 이미지·비디오 모델의 정확도와 성능이 높아지면 더 많은 실제 데이터와 상호작용, 작업 수행, 데이터 저장까지 포함하는 환경으로 확장될 수 있음

개요

실시간 온디맨드 생성으로 동작하는 무한 시각 브라우저이며, 사용자가 도착하는 모든 페이지를 이미지로 구성함
화면에는 HTML, 코드, 특정 링크나 입력 필드가 없고, 이미지 안의 대상을 클릭하면 그 대상을 더 깊게 탐색하는 새 이미지가 생성됨
웹을 문서와 UI 요소의 집합이 아니라, 화면 위에 생성되는 픽셀 중심 인터페이스로 다시 구성함

동작 방식과 확장 방향

화면의 모든 텍스트도 이미지 모델이 픽셀로 직접 렌더링하며, 이미지 위에 별도의 텍스트 오버레이를 얹지 않음
- 그 결과 텍스트가 불완전하거나 잘못된 위치에 나타날 때가 있으며, 모델이 개선될수록 나아질 수 있다고 적혀 있음
이미지 안의 정보는 agentic web search와 이미지 모델의 자체 세계 지식을 함께 사용해 만듦
- 가끔 부정확할 수 있지만, 온라인의 실제 데이터에 보통 근거를 두는 유용한 출발점으로 소개됨
- 사실 정확도는 ChatGPT, Gemini, Claude를 사용할 때 기대할 수 있는 수준과 비슷하다고 적혀 있음
텍스트와 색 사각형 위주의 화면 대신, 풍부한 시각 표현으로 정보를 전달하는 컴퓨팅 경험을 목표로 둠
고정된 코드와 규칙만으로는 복잡하고 세밀한 아이디어를 전달하기 어렵다고 보고, 상황에 따라 한 단어, 일러스트, 사실적인 렌더링처럼 가장 효과적인 표현 방식을 택하는 방향을 강조함
live video stream은 정적인 이미지를 더 연속적인 비디오 스트림으로 바꾸는 실험 기능이며, 각 탐색 이미지를 애니메이션화하고 그 사이 전환을 더 매끄럽게 만듦
- 현재 동작은 다소 예측하기 어렵고 자원 소모도 커서, 켜고 끌 수 있는 토글 뒤에 두고 있음
- 지금은 고도로 최적화된 커스텀 비디오 생성 모델과 이미지 생성 시스템 두 개를 함께 쓰며, 앞으로는 단일 시스템으로 통합할 계획이라고 적혀 있음
현재는 실험적 탐색·학습 도구로 설계됐지만, 이미지·비디오 모델의 정확도와 성능이 높아지면 더 많은 실제 데이터를 포함하고, 상호작용하고, 직접 작업을 수행하며 자체 데이터를 저장하는 페이지로 확장될 수 있음
- 다음 여행을 조사한 뒤 다른 곳에서 예약하는 수준에서, Flipbook 안에서 전 과정을 처리하는 수준으로 바뀔 수 있다고 예시를 듦
- 지금은 별도 앱과 웹사이트가 필요한 작업도, 앞으로는 Flipbook처럼 보이고 동작하는 환경 안에서 더 많이 처리할 수 있다고 적혀 있음
임베디드 비디오를 지원하지 않는 브라우저에서는 재생되지 않음
시연은 미리 생성된 비디오를 사용하며, 속도를 위해 편집돼 있음