最近在研究 AI Agent 的内容自动化能力,顺手把三个紧密相关的开源工具串了起来。这篇是实用教程,不讲空泛的概念,每个工具讲清楚:它是什么、为什么值得用、怎么上手


一、三件套概览

三件套解决的问题不同,但组合起来能覆盖”内容采集 → 浏览器操作 → 多平台分发”的完整链路:

工具 核心定位 解决的问题
AiToEarn AI 内容分发平台 一键把内容发布到 12+ 个社交媒体
Browser Harness CDP 浏览器控制框架 让 LLM Agent 直接操控 Chrome
CamoFox 反检测浏览器 AI Agent 绕过反爬虫,稳定访问各平台

三者组合后的能力:让 Agent 自动完成”采集→处理→发布”全流程。


二、AiToEarn:AI 驱动的多平台内容分发

2.1 它是什么

AiToEarn 是一个 AI 驱动的内容分发平台,核心卖点是一键把内容同步到多个社交媒体。国内支持抖音、小红书、B站、快手、视频号、微信公众号;国际支持 TikTok、YouTube、Facebook、Instagram、Threads、Twitter、Pinterest、LinkedIn——合计 12+ 平台。

2.2 核心特性

AI 内容生成能力内置其中,不只是分发,还支持:

  • AI 内容生成(文字/图片/视频)
  • 批量任务发布
  • MCP 接口(可在 Claude/Cursor 等 AI 助手中直接调用)

MCP 地址:https://aitoearn.ai/api/unified/mcp

这意味着你可以在 Claude 里说”帮我发一篇小红书”,直接调用 AiToEarn 的能力完成发布,不用跳转到 AiToEarn 控制台。

Relay 模式值得单独说:借用官方 OAuth 凭据即可,不需要自己申请各平台的开发者账号。对个人用户和小团队来说,这省掉了大量申请 API Key 的精力。

2.3 部署

官方推荐 Docker 一键部署:

1
2
3
git clone <repo>
cd <project>
docker compose up -d

源码部署会遇到 Nx monorepo 构建路径问题,官方文档也承认这一点,建议直接上 Docker。

硬件要求:2 核 CPU + 4~6 GB 内存。注意云电脑的”2 核”经常是超售核,实际可用资源可能不足。

2.4 使用建议

  • 个人用户优先用 Web 版(国内 aitoearn.cn / 国际 aitoearn.ai
  • 团队/批量场景用 Docker 部署
  • MCP 接口适合与 AI 编程工具集成

三、Browser Harness:CDP 浏览器控制框架

3.1 它是什么

Browser Harness 是一个轻量级的浏览器控制框架,核心思路是通过 CDP(Chrome DevTools Protocol)把 LLM Agent 直接连到真实浏览器

传统浏览器自动化(如 Playwright、Selenium)走的是”浏览器 → 代理层 → Agent”的路径。Browser Harness 砍掉了中间层,Agent 和 Chrome 之间只有一条 WebSocket 连接

3.2 架构

1
2
3
4
5
Chrome / Browser Use Cloud
↓ CDP WebSocket
browser_harness.daemon ←→ IPC ←→ browser_harness.run (CLI)

agent_workspace/agent_helpers.py ← Agent 可编辑辅助函数

核心文件:

  • src/browser_harness/helpers.py — CDP 封装和核心浏览器原语
  • src/browser_harness/daemon.py — CDP WebSocket 守护进程 + IPC 中继
  • src/browser_harness/admin.py — 守护进程生命周期管理
  • src/browser_harness/run.py — CLI 入口
  • agent-workspace/agent_helpers.py — Agent 自进化写入的自定义函数

3.3 自进化能力

这是 Browser Harness 最有意思的设计:Agent 在执行过程中如果发现某个辅助函数缺失,可以自动写入 agent_helpers.py。下次再用到相同的交互模式,直接调用已写好的函数。

简单说:Agent 用得越多,它自己的工具库越丰富——跟人学技能一个道理。

3.4 Domain Skills 生态

社区已经为常用平台贡献了站点特定技能,直接可用的 Domain Skills 包括:

  • 社交平台:bilibili, github, linkedin, reddit, tiktok, xiaohongshu, youtube, facebook, x, twitter
  • 电商平台:amazon, ebay, etsy, shopify-admin, walmart, zillow
  • 求职平台:BOSS-zhipin, glassdoor, wellfound, linkedin
  • 其他:arxiv, goodreads, gutenberg, imdb, spotify, steam 等

3.5 Interaction Skills

提供可复用的 UI 交互指南,覆盖常见浏览器操作场景:对话框处理、标签页管理、下拉菜单、跨域 iframe、文件上传、截图、Cookie 管理、网络请求等。这些 Markdown 指南可以直接被 Agent 读取和遵循。

3.6 使用建议

  • 本地使用:启动 Chrome with remote debugging,连接 daemon
  • 云浏览器:Browser Use Cloud 免费提供 3 个并发浏览器
  • 有现成 Domain Skill 的平台优先用 Skill,能大幅减少 Agent 的试错时间

四、CamoFox Browser:AI Agent 专用的反检测浏览器

4.1 它是什么

CamoFox Browser 是由 Jo 团队(jo-inc)开发的反检测浏览器自动化服务器,底层基于 Camoufox——一个深度定制的 Firefox 分支。

为什么需要专门的”反检测”浏览器?因为很多平台会通过 JavaScript 层面的指纹检测(navigator 属性、WebGL、Canvas、WebRTC 等)来判断访问者是不是自动化工具。普通 Playwright 或 Puppeteer 在这种检测面前基本裸奔。

4.2 C++ 级反检测

Camoufox 的厉害之处在于在 C++ 实现层面(不是 JS 注入层)就伪造了指纹参数:

  • navigator.hardwareConcurrency
  • WebGL renderer
  • AudioContext fingerprint
  • Screen geometry
  • WebRTC 真实 IP 泄露

这些参数在 JavaScript 执行前就已经被伪装好了,检测难度远高于 Playwright Stealth 那种 JS 注入方案。

4.3 核心特性

稳定元素引用(Element Refs)

e1e2e3 等稳定标识符替代 CSS 选择器,点击操作的可靠性大幅提升。CSS 选择器在页面变化时经常失效,Element Refs 从根本上解决了这个问题。

资源效率

  • 无障碍快照比原始 HTML 小约 90%,大幅降低 LLM 调用的 token 成本
  • 惰性浏览器启动 + 空闲自动关闭,空闲时内存仅约 40MB

会话隔离

每个用户独立 cookies/storage,多任务并发不会互相干扰。

Cookie 导入

支持导入 Netscape 格式 cookie 文件,导入后免登录直接访问已认证的站点。

代理 + GeoIP

支持住宅代理,自动配置 locale 和 timezone,配合 GeoIP 做到”看起来就是当地用户”。

搜索宏(Search Macros)

内置 15+ 预设搜索命令,@google_search@youtube_search@amazon_search@reddit_subreddit 等,Agent 可以直接用自然语言触发搜索。

YouTube 字幕提取

内置 yt-dlp 支持,提取字幕不需要 API Key。

VNC 交互登录

通过 noVNC 可视化登录站点,导出存储状态供 Agent 复用——适合需要扫码或验证码登录的场景。

会话追踪(Tracing)

可选开启 Playwright trace 录制,捕获截图 + DOM + 网络请求,用于调试和审计。

4.4 与 Playwright 对比

特性 Playwright Playwright Stealth Camoufox/CamoFox
指纹伪造层级 JavaScript 注入 C++ 实现层
可检测性
WebGL 伪装 部分
AudioContext 伪装
稳定元素引用 ✅(e1/e2/e3)
Token 效率 基准 基准 降低 90%

4.5 使用建议

  • 目标平台反爬虫严格(Google、Cloudflare 验证页)时优先用 CamoFox
  • 大量并发任务时资源占用优势明显
  • 通过 OpenClaw 插件方式集成(Jo 团队作为 OpenClaw 插件维护)

五、三件套组合实战

三个工具各自的定位清楚了,关键是它们怎么配合

5.1 典型工作流

1
2
3
4
5
内容采集(Browser Harness + CamoFox)

内容加工(AiToEarn AI 生成)

多平台发布(AiToEarn 分发)

第一步:采集

用 CamoFox + Browser Harness 组合,让 Agent 自动采集目标平台的内容(如竞品动态、热点话题)。CamoFox 负责绕过反爬,Browser Harness 的 Domain Skills 直接提供对应平台的交互逻辑,不需要从头写选择器。

第二步:加工

采集到的内容通过 AiToEarn 的 AI 生成能力进行改写、扩写、生成配图。AiToEarn 内置 AI 内容生成,不需要单独调 LLM API。

第三步:发布

加工后的内容通过 AiToEarn 一次发布到多个平台。如果是通过 MCP 接口集成,甚至可以让 Claude/Cursor 一句话完成”采集→加工→发布”全流程。

5.2 MCP 集成路线

1
2
3
4
5
6
7
8
9
10
// Claude Desktop config 示例
{
"mcpServers": {
"aitoearn": {
"command": "npx",
"args": ["-y", "@aitoearn/mcp-server"],
"env": { "AITOEARN_API_KEY": "your-key" }
}
}
}

配置完成后,在 Claude 对话里就能直接调用:

1
"用 AiToEarn 发布一篇关于 Browser Harness 的教程到小红书和 Twitter"

5.3 选择建议

场景 推荐组合
纯内容发布 AiToEarn 单独使用
需要采集/操作网页 Browser Harness + AiToEarn
反爬虫严格 CamoFox + Browser Harness + AiToEarn
全自动工作流 三件套 + MCP 集成

六、部署参考与总结

6.1 部署方式对比

方式 适用场景 复杂度
Web 在线版 个人/轻量使用 最低
Docker Compose 团队/批量
源码构建 二次开发 高(Nx 构建问题)

6.2 硬件参考

  • AiToEarn:2 核 + 4~6 GB 内存
  • Browser Harness:依赖 Chrome,资源占用与 Chrome 相当
  • CamoFox:空闲 ~40MB,根据并发浏览器数量线性增长

6.3 注意事项

AiToEarn

  • 源码部署存在 Nx monorepo 构建问题,优先 Docker
  • 云电脑资源评估要打折扣,2 核可能实际不足
  • Relay 模式是快速上手的捷径,但长期建议走自有 OAuth

Browser Harness

  • 需要 Chrome 启用 remote debugging 端口
  • 自进化写入的 agent_helpers.py 是增量积累,初期函数少是正常的

CamoFox

  • C++ 级伪装 ≠ 绝对不可检测,高安全目标的平台(如 Google 账号级检测)仍需人工介入
  • VNC 可视化登录导出状态是处理复杂验证码的有效手段
  • 通过 OpenClaw 插件方式集成最为方便

6.4 写在最后

三件套的分工非常清晰:AiToEarn 管发布、Browser Harness 管控制、CamoFox 管渗透。各自的功能边界明确,组合在一起能覆盖 AI 内容自动化的主要场景。

对于已经在用 AI Agent 做内容运营的团队,这套组合值得认真评估。特别适合的场景:多平台矩阵运营、竞品动态追踪、热点内容快速响应。


本文基于三份研究报告整理采写,所有技术细节均来自公开资料和项目文档。