AI가 대신 클릭 — 반복 웹작업 무료 자동화 3단계

AI가 대신 클릭 — 반복 웹작업 무료 자동화 3단계

·(주)비젼솔루션·3

AI가 직접 브라우저를 열고 클릭하는 오픈소스 Browser-Use. GitHub 별 9.9만 개 돌파, 무료 Docker 설치 20분. 가격 비교·정부 공고 수집·예약 자동화까지 — 중소기업 실습 가이드.

📋 목차클릭하여 접기/펼치기
  1. 1.AI가 직접 마우스를 잡는다 — Browser-Use
  2. 2.중소기업 활용 시나리오 3가지
  3. 3.지금 설치하는 법 — web-ui Docker 버전
  4. 4.솔직하게 — 장점과 한계
  5. 5.비젼솔루션의 시각
  6. 6.자주 묻는 질문
  7. 7.함께 보면 좋은 글

오전 9시, 윤 대리는 오늘도 탭 8개를 열었다. 쿠팡, 네이버쇼핑, 11번가, 경쟁사 사이트. 하나씩 들어가 가격을 확인하고 엑셀에 옮기는 데 한 시간 반이 걸린다. 이 일을 3년째 매일 반복하고 있다.

그런데 요즘 AI는 이 일을 대신할 수 있다. 마우스 클릭부터 검색, 입력, 스크롤까지. 사람이 하던 방식 그대로.

AI가 직접 마우스를 잡는다 — Browser-Use

Browser-Use는 AI가 사람처럼 웹브라우저를 직접 조작하는 오픈소스 파이썬 도구다. 2024년 말 GitHub에 등장했고, 현재 별 9.9만 개를 넘겼다.

쉽게 설명하면 이렇다. 채팅창에 "네이버쇼핑에서 냉장고 최저가 3개 찾아줘"라고 입력하면, AI가 실제로 브라우저를 열어 검색하고, 결과를 정리해서 돌아온다. 기존 자동화 도구처럼 "어떤 버튼을 클릭하라"는 규칙을 직접 짤 필요가 없다. 의도만 전달하면 AI가 판단한다.

VISIONC 마스코트

지원 AI도 넓다. ChatGPT(OpenAI), Claude(Anthropic), Gemini(Google), Ollama(무료 로컬 AI)까지. API 키만 있으면 된다. 상업용·무료를 혼용하거나, 완전 무료인 Ollama만으로도 시작할 수 있다.

Browser-Use 동작 원리 ▲ Browser-Use 동작 3단계 · 출처: github.com/browser-use/browser-use

중소기업 활용 시나리오 3가지

반복적인 웹 작업이라면 어디든 붙일 수 있다. 실제로 자주 쓰이는 세 가지를 보자.

가격 비교 자동화: 가구 쇼핑몰을 운영하는 김 사장은 매주 경쟁사 5곳의 주력 제품 가격을 손으로 수집했다. "쿠팡·네이버쇼핑·오늘의집에서 '3인용 패브릭 소파' 가격 리스트 만들어줘"라고 입력하면 AI가 탭을 직접 열어 정리해준다. 한 시간짜리 작업이 5분으로 줄었다.

정부 공고 수집: 제조업체 영업팀은 중소벤처기업부·조달청·지역 지원센터 공고를 매일 손으로 확인했다. "오늘 올라온 제조업 관련 정부 지원 공고 목록 정리해줘"라고 하면 AI가 사이트를 순회하며 새 공고를 수집한다. 시간이 없어 놓쳤던 보조금 공고를 잡아낸 팀도 있다.

예약 및 폼 제출 자동화: 병원 예약, 공공 시설 예약, 정기 신청서 제출처럼 매번 같은 폼을 채우는 작업도 가능하다. 입력 항목과 답을 미리 지정해두면 AI가 폼을 열어 채우고 제출까지 마친다.

VISIONC 마스코트

Browser-Use 핵심 수치 ▲ Browser-Use 주요 지표 · 출처: github.com/browser-use/browser-use, github.com/browser-use/web-ui

지금 설치하는 법 — web-ui Docker 버전

Browser-Use 팀이 만든 web-ui 버전은 코딩 없이 브라우저 화면에서 바로 쓸 수 있다. Docker만 설치되어 있으면 된다.

필요한 것:

  • 컴퓨터 RAM 8GB 이상 권장 (4GB도 가능하나 느림)
  • Docker Desktop 설치 (무료, Windows·Mac·Linux 모두 지원)
  • AI API 키 1개 — OpenAI, Anthropic Claude, Google Gemini 중 하나. 돈 안 드는 Ollama도 연결 가능

1단계 — Docker Desktop 설치

docker.com/products/docker-desktop 에서 무료 다운로드.

2단계 — web-ui 파일 받기

터미널(윈도우: 명령 프롬프트)에서:

git clone https://github.com/browser-use/web-ui.git
cd web-ui

3단계 — API 키 설정

.env.example 파일을 .env로 복사한 뒤 AI API 키를 입력한다.

OPENAI_API_KEY=sk-...      # ChatGPT 키 (둘 중 하나만)
ANTHROPIC_API_KEY=sk-...   # Claude 키

4단계 — 실행

docker compose up

브라우저에서 http://localhost:7788 접속. 웹 화면이 열리면 완료다.

5단계 — 업무 지시 예시 (복붙 가능)

네이버쇼핑에서 '무선 청소기' 최저가 3개를 찾아서 제품명, 가격, 링크를 표로 정리해줘
중소벤처기업부 홈페이지에서 오늘 등록된 공고 제목과 마감일을 수집해줘

설치부터 첫 실행까지 약 20분. AI API 사용량에 따라 비용이 발생하며, 가벼운 일상 자동화 수준이라면 월 수천 원 이내에서 시작할 수 있다. Ollama를 쓰면 API 비용 없이 완전 무료다.

web-ui 설치 흐름 ▲ web-ui 설치 3단계 흐름 · 출처: github.com/browser-use/web-ui README

솔직하게 — 장점과 한계

이런 경우에 적합하다: 매일 반복되는 웹 수집 작업, 사이트 구조가 크게 안 바뀌는 업무(공공 기관 공고, 쇼핑몰 가격 등), AI API 소액 비용을 감수할 의사가 있는 경우.

이런 경우엔 한계가 있다: 로그인 2단계 인증(OTP)이 걸린 사이트는 막힐 수 있다. 사이트 구조가 자주 바뀌면 프롬프트를 다시 손봐야 한다. 수천 건 대량 처리는 속도가 느리고 API 비용이 높아진다.

다른 자동화 도구와 비교하면: n8n(노코드 자동화)이나 Selenium(코딩 자동화)과 다른 점은 브라우저를 사람처럼 "눈으로 보며" 판단한다는 것이다. 팝업·동적 폼 같은 요소에 더 유연하게 대응한다. 반면 대규모 데이터 처리나 API가 이미 열려 있는 서비스는 n8n + API 조합이 더 빠르고 안정적이다.

VISIONC 마스코트

비젼솔루션의 시각

Browser-Use가 흥미로운 이유는 방향성 때문이다. 기존 자동화 도구는 "이 버튼을 클릭하라"는 규칙을 사람이 직접 짰다. 사이트가 바뀌면 규칙도 다시 짜야 했다. Browser-Use는 AI가 화면을 보고 스스로 판단한다. 규칙 대신 의도를 전달한다. 이 차이는 작아 보이지만 자동화 유지보수 비용을 근본적으로 낮춘다. IT 인력이 없는 중소기업에게 현실적인 진입점이 생긴 셈이다.

물론 도구는 도구다. 어떤 업무에 어떻게 붙일지는 여전히 사람의 판단이 필요하다. 설치까지는 직접 해볼 수 있고, 실제 업무 자동화 설계가 필요하다면 검토를 도와드릴 수 있다.


자주 묻는 질문

Q. API 키 없이 완전 무료로 쓸 수 있나요? Ollama를 이용하면 무료 로컬 AI를 연결할 수 있습니다. 다만 클라우드 AI(ChatGPT, Claude)보다 정확도가 떨어질 수 있습니다.

Q. 맥북에서도 가능한가요? 네. Docker Desktop은 macOS, Windows, Linux 모두 지원합니다.

Q. AI가 잘못된 버튼을 누르면 어쩌죠? 처음엔 결과 수집 같은 읽기 전용 작업부터 테스트하는 걸 권장합니다. 결제·신청·전송이 포함된 작업은 사람이 최종 확인 후 실행하는 흐름으로 설계해야 합니다.


Vision Solution AI 자동화 도입 문의: 📧 [email protected] 🌐 https://www.visionc.co.kr/ai-solution

함께 보면 좋은 글

우리 회사도 이렇게 할 수 있을까요?

무료 상담을 통해 현재 상황에 맞는 솔루션을 제안해드립니다.