Playwright MCP - LLM을 위한 웹 브라우저 자동화용 MCP 서버

5 days ago 6

  • Playwright를 기반으로 동작하는 MCP(Model Context Protocol) 서버
  • LLM이 웹 페이지와 상호작용할 수 있도록 구조화된 접근성 스냅샷을 제공하여 빠르고 가벼움
  • 스크린샷이나 비전 모델 없이 구조화된 텍스트 기반 데이터만으로 웹 자동화를 구현
  • 용도 : 웹 페이지 탐색 및 폼 자동 작성, 구조화된 콘텐츠에서의 데이터 추출, LLM 기반 자동화 테스트, 에이전트 기반 일반 웹 브라우저 제어

설치

  • config { "mcpServers": { "playwright": { "command": "npx", "args": [ "@playwright/mcp@latest" ] } } }
  • VSCode에 바로 설치 가능 : Install in VS Code Insiders
    • 설치 후, VSCode의 GitHub Copilot 에이전트에서 Playwright MCP를 사용할 수 있음

Snapshot Mode 도구 목록

  • browser_navigate: URL로 이동
  • browser_go_back / go_forward: 뒤로/앞으로 이동
  • browser_click / hover / drag: 요소 클릭, 호버, 드래그
  • browser_type: 입력란에 텍스트 입력 (옵션: submit)
  • browser_select_option: 드롭다운 선택
  • browser_press_key: 키보드 키 입력
  • browser_snapshot: 접근성 스냅샷 캡처
  • browser_save_as_pdf: 페이지를 PDF로 저장
  • browser_wait: 지정 시간 대기 (time은 최대 10초)
  • browser_close: 페이지 닫기

Vision Mode 도구 목록

  • browser_navigate / go_back / go_forward
  • browser_screenshot: 스크린샷 캡처
  • browser_move_mouse / click / drag: 좌표 기반 마우스 제어
  • browser_type: 좌표 위치에 텍스트 입력
  • browser_press_key
  • browser_save_as_pdf
  • browser_wait
  • browser_close

Read Entire Article