크롬 프롬프트 API

3 hours ago 1
  • Chrome에 내장된 Gemini Nano 모델에 자연어 요청을 보내는 브라우저 네이티브 API로, 서버 왕복 없이 온디바이스에서 AI 추론 수행
  • AI 기반 검색, 뉴스 분류를 통한 맞춤 피드, 콘텐츠 필터링, 캘린더 일정 생성, 연락처 추출 등 다양한 활용 가능
  • prompt()로 한번에 응답 또는 promptStreaming()으로 ReadableStream 기반 스트리밍 응답 선택 가능
  • 세션 기반 컨텍스트 관리, 스트리밍 응답, 세션 클론 등 세밀한 세션 제어 기능 제공
  • 서버 왕복 없이 브라우저 내에서 AI 추론이 이루어져 개인정보 보호와 응답 지연 최소화에 유리함
  • 텍스트뿐 아니라 이미지와 오디오 입력을 지원하는 멀티모달 기능 내장
    • 오디오: AudioBuffer, ArrayBuffer, Blob 등
    • 이미지: HTMLImageElement, HTMLCanvasElement, VideoFrame, Blob 등
  • responseConstraint 필드에 JSON 스키마를 전달해 모델 출력 형식을 boolean, 특정 JSON 구조 등으로 제한 가능
  • initialPrompts로 시스템 프롬프트와 이전 대화 컨텍스트를 주입하고, append()로 세션 생성 후에도 추가 컨텍스트를 사전 전송 가능
  • 후행 assistant 메시지에 prefix: true를 추가하면 모델이 특정 형식으로 응답을 시작하도록 유도 가능
  • 세션별 컨텍스트 윈도우 관리 지원: contextUsage/contextWindow로 토큰 사용량 확인, 오버플로 시 초기 대화를 자동 삭제 (시스템 프롬프트는 유지)
  • clone()으로 세션 포크, destroy()로 리소스 해제, AbortSignal로 세션 및 프롬프트 중도 취소 가능
  • expectedInputs/expectedOutputs로 입출력 형식과 언어 설정 가능 (현재 en, ja, es 지원)
  • 하드웨어 요구사항: Windows 10+/macOS 13+/Linux/ChromeOS, 저장공간 22GB 이상, GPU VRAM 4GB 초과 또는 CPU RAM 16GB 이상 + 코어 4개 이상
  • 교차 Origin iframe에는 allow="language-model" 속성으로 접근 위임 가능, 웹 워커에서는 현재 미지원
  • Chrome 138부터 오리진 트라이얼로 제공 중
Read Entire Article