在 AI 时代,浏览器不应仅仅是一个展示网页的工具,它应该是一个能帮你“干活”的智能助手。今天为大家介绍一款近期在 GitHub 上备受关注的开源项目——BrowserOS

GitHub 地址: https://github.com/browseros-ai/BrowserOS

BrowserOS 不仅仅是 Chrome 的套壳,它是一款基于 Chromium 构建的Agentic Browser(代理浏览器)。它的核心理念是:让 AI Agent(智能体) 直接在浏览器本地运行,帮你自动化执行点击、输入、浏览、数据抓取等任务,同时最大程度保护你的隐私。如果您对更多 AI 工具感兴趣,可以访问 AI225导航


🧐 什么是 BrowserOS?

BrowserOS 是一个开源的 Web 浏览器,旨在将 AI 智能体原生集成到浏览体验中。与需要将数据发送到云端的传统 AI 浏览器不同,BrowserOS 强调本地化隐私优先

你可以把它理解为:“一个内置了全自动 AI 员工的 Chrome 浏览器”。

核心亮点:

  1. 原生 AI Agent 支持:通过自然语言指令(如“帮我查一下亚马逊上最便宜的机械键盘并整理成表格”),浏览器会自动打开网页、点击搜索、翻页、提取数据。
  2. 隐私优先 (Privacy-First):支持运行本地大模型(通过 Ollama、LMStudio),或者使用你自己的 API Key(OpenAI, Anthropic 等)。你的浏览历史和 Cookie 不会被上传到第三方服务器。
  3. 无缝迁移:基于 Chromium 内核,完全兼容 Chrome 插件。你可以直接导入 Chrome 的书签、密码和扩展,零学习成本上手。
  4. MCP 协议支持:支持 Model Context Protocol (MCP),可以作为 MCP Server 被 Claude Desktop 或其他开发者工具调用,实现更复杂的跨应用自动化。

🌟 核心功能详解

1. 🤖 真正的“网页自动驾驶”

BrowserOS 内置了强大的 Agent 框架。你不需要懂 Python 或 Selenium,只需要在地址栏或侧边栏输入自然语言指令。

  • 场景举例
    • 自动填表:告诉它“帮我把这些个人信息填入这个报名表”。
    • 数据抓取:告诉它“抓取这个页面所有的职位名称和薪资,并保存”。
    • 复杂任务:告诉它“去 Google News 搜索关于 AI 的最新新闻,总结前 5 篇的内容”。

2. 🛡️ 隐私与模型自由

这是 BrowserOS 与 Perplexity 或 Arc Search 最大的不同点。它允许你完全掌控 AI 大脑:

  • 本地模型:支持连接 Ollama 或 LM Studio。如果你有显卡,可以在本地运行 Llama 3 或 DeepSeek,实现完全离线的 AI 自动化,数据不出本地,隐私绝对安全。
  • 云端模型:支持绑定你自己的 OpenAI (GPT-4o)、Anthropic (Claude 3.5 Sonnet) 或 Google Gemini 的 API Key。

3. 🖥️ 分屏协作 (Split-View)

BrowserOS 提供了一个原生的侧边栏(Split-View),你可以在浏览网页的同时,在侧边栏与 AI 对话。

  • AI 可以读取当前网页的内容(Context Aware)。
  • 你可以一键让 AI 总结当前长文、提取关键信息或翻译网页。

4. 🧩 兼容 Chrome 生态

很多 AI 浏览器为了创新 UI 而牺牲了兼容性,但 BrowserOS 保留了 Chromium 的界面布局。

  • 你常用的 uBlock OriginReact Developer ToolsTampermonkey 等插件都可以直接安装使用。
  • 符合用户直觉,无需重新适应操作逻辑。

🛠️ 安装与快速上手

1. 下载安装

目前 BrowserOS 支持 macOS、Windows 和 Linux。

  • 前往 GitHub Releases 页面下载对应版本:Releases 链接
  • Windows: 下载 .exe 文件。
  • macOS: 下载 .dmg 文件(支持 Apple Silicon 和 Intel)。
  • Linux: 提供 .AppImage 或 .deb 包。

2. 配置 AI 模型

初次启动后,建议先配置 AI 模型,否则无法使用 Agent 功能。

  1. 点击浏览器右上角的 设置 (Settings) 图标。
  2. 进入 AI Provider 选项卡。
  3. 使用云端模型:选择 OpenAI 或 Anthropic,输入你的 API Key。
  4. 使用本地模型
    • 确保你电脑上已安装并运行了 Ollama (默认端口 11434)。
    • 在 BrowserOS 设置中选择 Ollama,并输入模型名称(如 llama3 或 qwen2.5)。

3. 运行你的第一个 Agent

  1. 在浏览器地址栏输入 / (斜杠),会唤起 Agent 菜单。
  2. 或者点击侧边栏的 Agent 图标。
  3. 输入指令,例如:Open youtube.com and search for 'BrowserOS tutorial'
  4. 见证魔法:你会看到浏览器自动打开新标签页,输入文字,点击搜索按钮,完全不需要你动手。

💻 进阶玩法:作为 MCP Server 使用

对于开发者来说,BrowserOS 还有一个杀手级功能:它可以作为一个 MCP Server

这意味着,你可以使用 Claude Desktop 或终端里的 Claude Code 来远程控制 BrowserOS。

  • 配置方法:在设置中开启 MCP Server 功能,获取本地端口(通常是 9225)。
  • 应用场景:你在写代码时,可以让 Claude“去浏览器里帮我查一下这个报错怎么解决”,Claude 会通过协议指挥 BrowserOS 进行搜索并把结果返回到你的 IDE 中。

📝 总结

BrowserOS 是目前开源界非常罕见的、完成度较高的 Agentic Browser。它填补了“普通浏览器”和“全自动爬虫脚本”之间的空白。

适合人群:

  • 开发者/极客:喜欢折腾本地大模型,想要一个能编程控制的浏览器。
  • 数据分析师:需要频繁从网页抓取数据,但不想写复杂的爬虫代码。
  • 隐私敏感用户:希望拥有 AI 辅助,但绝对不愿意将浏览数据上传给 AI 公司的用户。

项目前景:
虽然项目目前还处于早期阶段(Beta),但迭代速度非常快。如果你看好 Local AI Agent 的未来,BrowserOS 绝对是一个值得 Star 和尝试的项目。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐