Gemma Gem - 브라우저에서 Google Gemma 4 모델을 완전 온디바이스로 실행하는 Chrome 확장

6 hours ago 4
  • Google의 Gemma 4 모델WebGPU 기반으로 완전 온디바이스 실행해서 브라우저 안에 상주하는 개인 AI 어시스턴트로 활용
  • API 키·클라우드·외부 데이터 전송 없음 - 모든 추론이 로컬에서 처리되며 데이터가 기기를 벗어나지 않음
  • 방문 중인 페이지 읽기, 버튼 클릭, 폼 입력, JavaScript 실행, 사이트에 대한 질의응답 수행하는 에이전트형 동작 지원
  • Gemma 4 E2B(~500MB) / E4B(~1.5GB) 두 모델 중 선택 가능하며 첫 실행 후 캐시되어 재사용
  • q4f16 양자화, 128K 컨텍스트 지원 (onnx-community/gemma-4-E2B-it-ONNX, onnx-community/gemma-4-E4B-it-ONNX)
  • 6가지 내장 도구 제공
    • read_page_content: 페이지 텍스트/HTML 또는 CSS selector 기준 읽기
    • take_screenshot: 보이는 페이지를 PNG로 캡처
    • click_element / type_text / scroll_page: CSS selector 기반 DOM 조작
    • run_javascript: 페이지 컨텍스트에서 DOM 전체 접근 가능한 JS 실행
  • Offscreen Document + Service Worker + Content Script 3계층 구조
    • Offscreen document가 @huggingface/transformers + WebGPU로 모델 호스팅 및 에이전트 루프 실행
    • Service worker는 메시지 라우팅과 스크린샷·JS 실행 담당
    • Content script는 gem 아이콘과 shadow DOM 채팅 오버레이 주입
  • 설정에서 모델 전환, Thinking 토글, 도구 호출 루프 상한, 대화 기록 초기화, 사이트별 비활성화 지원
  • agent/ 디렉터리는 의존성 제로, ModelBackend·ToolExecutor 인터페이스 기반으로 독립 라이브러리화 가능
  • WebGPU 지원 Chrome 필요 / Apache-2.0 라이선스 / TypeScript 기반 구현
Read Entire Article