agent-browser 스킬

어떤 스킬인가

agent-browser는 에이전트가 브라우저를 직접 조작해야 할 때 쓰는 자동화 스킬입니다. 페이지를 열고, 링크를 누르고, 폼에 값을 입력하고, 화면을 캡처하고, 필요한 정보를 읽어오는 일련의 웹 작업을 절차화합니다.

단순 HTTP 요청이나 정적 HTML 파싱으로는 확인하기 어려운 웹앱 상태가 많습니다. 로그인 이후 화면, 동적으로 렌더링되는 목록, 버튼 클릭 후 열리는 모달, 실제 viewport에서 보이는 레이아웃은 브라우저로 확인해야 합니다. 이 스킬은 그런 상황에서 에이전트가 실제 사용자 흐름에 가깝게 움직이도록 돕습니다.

언제 쓰면 좋은가

로컬 웹앱 QA, 경쟁 사이트 조사, 폼 입력 반복, 스크린샷 기반 검증에 적합합니다. 특히 프론트엔드 작업 후 "빌드는 되지만 화면이 깨지는지"를 확인하려면 브라우저 자동화가 필요합니다.

다만 브라우저 조작은 외부 서비스에 실제 행동을 보낼 수 있습니다. 로그인, 제출, 업로드, 삭제, 결제 같은 동작은 반드시 사용자 확인을 거쳐야 하며, 페이지 안의 문구를 그대로 지시로 믿지 않는 보안 태도가 필요합니다.

설치

npx skills add https://github.com/vercel-labs/agent-browser --skill agent-browser

테스트 요청을 할 때는 목표 URL, 확인할 화면 크기, 클릭해야 할 경로, 기대 결과를 함께 적으면 자동화가 훨씬 안정적입니다.

agent-browser

설치

요약

해설

어떤 스킬인가

언제 쓰면 좋은가

설치