모델에서 직접 라이브 스트리밍되는 웹사이트
3 days ago
9
- 실시간 온디맨드 생성으로 모든 페이지를 이미지로 만들고, 이미지 안의 대상을 클릭하면 더 깊게 탐색하는 새 화면이 생성됨
- 화면에는 HTML이나 입력 필드가 없고, 텍스트까지 이미지 모델이 픽셀로 직접 렌더링하는 픽셀 중심 인터페이스로 동작함
- 페이지 정보는 agentic web search와 이미지 모델의 세계 지식을 함께 사용해 만들며, 정확도는 ChatGPT, Gemini, Claude에서 기대하는 수준과 비슷하다고 적혀 있음
- live video stream 기능은 탐색 이미지를 애니메이션화하고 전환을 매끄럽게 만들지만, 현재는 예측이 어렵고 자원 소모가 커서 토글 뒤에 숨겨져 있음
- 지금은 실험적 탐색·학습 도구에 가깝지만, 이미지·비디오 모델의 정확도와 성능이 높아지면 더 많은 실제 데이터와 상호작용, 작업 수행, 데이터 저장까지 포함하는 환경으로 확장될 수 있음
개요
- 실시간 온디맨드 생성으로 동작하는 무한 시각 브라우저이며, 사용자가 도착하는 모든 페이지를 이미지로 구성함
- 화면에는 HTML, 코드, 특정 링크나 입력 필드가 없고, 이미지 안의 대상을 클릭하면 그 대상을 더 깊게 탐색하는 새 이미지가 생성됨
- 웹을 문서와 UI 요소의 집합이 아니라, 화면 위에 생성되는 픽셀 중심 인터페이스로 다시 구성함
동작 방식과 확장 방향
- 화면의 모든 텍스트도 이미지 모델이 픽셀로 직접 렌더링하며, 이미지 위에 별도의 텍스트 오버레이를 얹지 않음
- 그 결과 텍스트가 불완전하거나 잘못된 위치에 나타날 때가 있으며, 모델이 개선될수록 나아질 수 있다고 적혀 있음
- 이미지 안의 정보는 agentic web search와 이미지 모델의 자체 세계 지식을 함께 사용해 만듦
- 가끔 부정확할 수 있지만, 온라인의 실제 데이터에 보통 근거를 두는 유용한 출발점으로 소개됨
- 사실 정확도는 ChatGPT, Gemini, Claude를 사용할 때 기대할 수 있는 수준과 비슷하다고 적혀 있음
- 텍스트와 색 사각형 위주의 화면 대신, 풍부한 시각 표현으로 정보를 전달하는 컴퓨팅 경험을 목표로 둠
- 고정된 코드와 규칙만으로는 복잡하고 세밀한 아이디어를 전달하기 어렵다고 보고, 상황에 따라 한 단어, 일러스트, 사실적인 렌더링처럼 가장 효과적인 표현 방식을 택하는 방향을 강조함
- live video stream은 정적인 이미지를 더 연속적인 비디오 스트림으로 바꾸는 실험 기능이며, 각 탐색 이미지를 애니메이션화하고 그 사이 전환을 더 매끄럽게 만듦
- 현재 동작은 다소 예측하기 어렵고 자원 소모도 커서, 켜고 끌 수 있는 토글 뒤에 두고 있음
- 지금은 고도로 최적화된 커스텀 비디오 생성 모델과 이미지 생성 시스템 두 개를 함께 쓰며, 앞으로는 단일 시스템으로 통합할 계획이라고 적혀 있음
- 현재는 실험적 탐색·학습 도구로 설계됐지만, 이미지·비디오 모델의 정확도와 성능이 높아지면 더 많은 실제 데이터를 포함하고, 상호작용하고, 직접 작업을 수행하며 자체 데이터를 저장하는 페이지로 확장될 수 있음
- 다음 여행을 조사한 뒤 다른 곳에서 예약하는 수준에서, Flipbook 안에서 전 과정을 처리하는 수준으로 바뀔 수 있다고 예시를 듦
- 지금은 별도 앱과 웹사이트가 필요한 작업도, 앞으로는 Flipbook처럼 보이고 동작하는 환경 안에서 더 많이 처리할 수 있다고 적혀 있음
- 임베디드 비디오를 지원하지 않는 브라우저에서는 재생되지 않음
- 시연은 미리 생성된 비디오를 사용하며, 속도를 위해 편집돼 있음
-
Homepage
-
Tech blog
- 모델에서 직접 라이브 스트리밍되는 웹사이트