📖 产品简介
Browser Use 是开源的浏览器自动化 Agent 框架,核心定位"让 LLM 具备网页导航和任务执行能力"。GitHub 快速破 5 万星,是 2026 年最受开发者欢迎的开源 Web Agent 基建之一。
基于 Playwright 构建,通过把网页 DOM 结构化后喂给 LLM,让模型输出"点击/输入/滚动/导航"等指令并执行。开发者可用 Python 几行代码即可让 Claude/GPT/Gemini 自主操作浏览器,是 Skyvern 等商业产品的开源替代。
⚡ 核心功能
- LLM 驱动浏览器:任意 LLM(GPT/Claude/Gemini)驱动 Playwright 操作浏览器
- 结构化 DOM 喂给模型:把网页元素提取成结构化数据,降低 LLM 理解难度
- Python 原生 API:几行代码即可启动 Web Agent
- 视觉 + 文本双模态:支持截图 + DOM 双路输入
- 开源可自定义:完全开源,可修改/扩展
- Multi-tab 支持:可同时管理多个标签页
🎯 适合谁用
以下类型的用户会特别受益于 Browser Use:
- 开发者构建自研 Web Agent
- 爬虫/数据采集升级版
- QA 自动化测试
- 竞品监控
- 自研 RPA 替代
✅ 优点亮点
- 开源界最受欢迎的 Web Agent 框架
- Python API 简洁
- 支持任意 LLM 作为大脑
- GitHub 5 万+ 星社区活跃
- 可自行扩展定制
💰 价格与方案
完全开源免费。运行成本 = LLM API 调用费用 + 自部署硬件。可搭配任何 OpenAI 兼容 API 使用。
📝 总结与建议
Browser Use 是开源 Web Agent 的事实标准——把"LLM 操作浏览器"降到了几行 Python。开发者搭建 Web Agent 首选;产品化需求可看 Skyvern 商业版。