AiToEarn + Browser Harness + CamoFox:AI 内容自动化三件套实战
最近在研究 AI Agent 的内容自动化能力,顺手把三个紧密相关的开源工具串了起来。这篇是实用教程,不讲空泛的概念,每个工具讲清楚:它是什么、为什么值得用、怎么上手。
一、三件套概览
三件套解决的问题不同,但组合起来能覆盖”内容采集 → 浏览器操作 → 多平台分发”的完整链路:
| 工具 | 核心定位 | 解决的问题 |
|---|---|---|
| AiToEarn | AI 内容分发平台 | 一键把内容发布到 12+ 个社交媒体 |
| Browser Harness | CDP 浏览器控制框架 | 让 LLM Agent 直接操控 Chrome |
| CamoFox | 反检测浏览器 | AI Agent 绕过反爬虫,稳定访问各平台 |
三者组合后的能力:让 Agent 自动完成”采集→处理→发布”全流程。
二、AiToEarn:AI 驱动的多平台内容分发
2.1 它是什么
AiToEarn 是一个 AI 驱动的内容分发平台,核心卖点是一键把内容同步到多个社交媒体。国内支持抖音、小红书、B站、快手、视频号、微信公众号;国际支持 TikTok、YouTube、Facebook、Instagram、Threads、Twitter、Pinterest、LinkedIn——合计 12+ 平台。
2.2 核心特性
AI 内容生成能力内置其中,不只是分发,还支持:
- AI 内容生成(文字/图片/视频)
- 批量任务发布
- MCP 接口(可在 Claude/Cursor 等 AI 助手中直接调用)
MCP 地址:https://aitoearn.ai/api/unified/mcp
这意味着你可以在 Claude 里说”帮我发一篇小红书”,直接调用 AiToEarn 的能力完成发布,不用跳转到 AiToEarn 控制台。
Relay 模式值得单独说:借用官方 OAuth 凭据即可,不需要自己申请各平台的开发者账号。对个人用户和小团队来说,这省掉了大量申请 API Key 的精力。
2.3 部署
官方推荐 Docker 一键部署:
1 | git clone <repo> |
源码部署会遇到 Nx monorepo 构建路径问题,官方文档也承认这一点,建议直接上 Docker。
硬件要求:2 核 CPU + 4~6 GB 内存。注意云电脑的”2 核”经常是超售核,实际可用资源可能不足。
2.4 使用建议
- 个人用户优先用 Web 版(国内
aitoearn.cn/ 国际aitoearn.ai) - 团队/批量场景用 Docker 部署
- MCP 接口适合与 AI 编程工具集成
三、Browser Harness:CDP 浏览器控制框架
3.1 它是什么
Browser Harness 是一个轻量级的浏览器控制框架,核心思路是通过 CDP(Chrome DevTools Protocol)把 LLM Agent 直接连到真实浏览器。
传统浏览器自动化(如 Playwright、Selenium)走的是”浏览器 → 代理层 → Agent”的路径。Browser Harness 砍掉了中间层,Agent 和 Chrome 之间只有一条 WebSocket 连接。
3.2 架构
1 | Chrome / Browser Use Cloud |
核心文件:
src/browser_harness/helpers.py— CDP 封装和核心浏览器原语src/browser_harness/daemon.py— CDP WebSocket 守护进程 + IPC 中继src/browser_harness/admin.py— 守护进程生命周期管理src/browser_harness/run.py— CLI 入口agent-workspace/agent_helpers.py— Agent 自进化写入的自定义函数
3.3 自进化能力
这是 Browser Harness 最有意思的设计:Agent 在执行过程中如果发现某个辅助函数缺失,可以自动写入 agent_helpers.py。下次再用到相同的交互模式,直接调用已写好的函数。
简单说:Agent 用得越多,它自己的工具库越丰富——跟人学技能一个道理。
3.4 Domain Skills 生态
社区已经为常用平台贡献了站点特定技能,直接可用的 Domain Skills 包括:
- 社交平台:bilibili, github, linkedin, reddit, tiktok, xiaohongshu, youtube, facebook, x, twitter
- 电商平台:amazon, ebay, etsy, shopify-admin, walmart, zillow
- 求职平台:BOSS-zhipin, glassdoor, wellfound, linkedin
- 其他:arxiv, goodreads, gutenberg, imdb, spotify, steam 等
3.5 Interaction Skills
提供可复用的 UI 交互指南,覆盖常见浏览器操作场景:对话框处理、标签页管理、下拉菜单、跨域 iframe、文件上传、截图、Cookie 管理、网络请求等。这些 Markdown 指南可以直接被 Agent 读取和遵循。
3.6 使用建议
- 本地使用:启动 Chrome with remote debugging,连接 daemon
- 云浏览器:Browser Use Cloud 免费提供 3 个并发浏览器
- 有现成 Domain Skill 的平台优先用 Skill,能大幅减少 Agent 的试错时间
四、CamoFox Browser:AI Agent 专用的反检测浏览器
4.1 它是什么
CamoFox Browser 是由 Jo 团队(jo-inc)开发的反检测浏览器自动化服务器,底层基于 Camoufox——一个深度定制的 Firefox 分支。
为什么需要专门的”反检测”浏览器?因为很多平台会通过 JavaScript 层面的指纹检测(navigator 属性、WebGL、Canvas、WebRTC 等)来判断访问者是不是自动化工具。普通 Playwright 或 Puppeteer 在这种检测面前基本裸奔。
4.2 C++ 级反检测
Camoufox 的厉害之处在于在 C++ 实现层面(不是 JS 注入层)就伪造了指纹参数:
navigator.hardwareConcurrency- WebGL renderer
- AudioContext fingerprint
- Screen geometry
- WebRTC 真实 IP 泄露
这些参数在 JavaScript 执行前就已经被伪装好了,检测难度远高于 Playwright Stealth 那种 JS 注入方案。
4.3 核心特性
稳定元素引用(Element Refs)
用 e1、e2、e3 等稳定标识符替代 CSS 选择器,点击操作的可靠性大幅提升。CSS 选择器在页面变化时经常失效,Element Refs 从根本上解决了这个问题。
资源效率
- 无障碍快照比原始 HTML 小约 90%,大幅降低 LLM 调用的 token 成本
- 惰性浏览器启动 + 空闲自动关闭,空闲时内存仅约 40MB
会话隔离
每个用户独立 cookies/storage,多任务并发不会互相干扰。
Cookie 导入
支持导入 Netscape 格式 cookie 文件,导入后免登录直接访问已认证的站点。
代理 + GeoIP
支持住宅代理,自动配置 locale 和 timezone,配合 GeoIP 做到”看起来就是当地用户”。
搜索宏(Search Macros)
内置 15+ 预设搜索命令,@google_search、@youtube_search、@amazon_search、@reddit_subreddit 等,Agent 可以直接用自然语言触发搜索。
YouTube 字幕提取
内置 yt-dlp 支持,提取字幕不需要 API Key。
VNC 交互登录
通过 noVNC 可视化登录站点,导出存储状态供 Agent 复用——适合需要扫码或验证码登录的场景。
会话追踪(Tracing)
可选开启 Playwright trace 录制,捕获截图 + DOM + 网络请求,用于调试和审计。
4.4 与 Playwright 对比
| 特性 | Playwright | Playwright Stealth | Camoufox/CamoFox |
|---|---|---|---|
| 指纹伪造层级 | 无 | JavaScript 注入 | C++ 实现层 |
| 可检测性 | 高 | 中 | 低 |
| WebGL 伪装 | ❌ | 部分 | ✅ |
| AudioContext 伪装 | ❌ | ❌ | ✅ |
| 稳定元素引用 | ❌ | ❌ | ✅(e1/e2/e3) |
| Token 效率 | 基准 | 基准 | 降低 90% |
4.5 使用建议
- 目标平台反爬虫严格(Google、Cloudflare 验证页)时优先用 CamoFox
- 大量并发任务时资源占用优势明显
- 通过 OpenClaw 插件方式集成(Jo 团队作为 OpenClaw 插件维护)
五、三件套组合实战
三个工具各自的定位清楚了,关键是它们怎么配合。
5.1 典型工作流
1 | 内容采集(Browser Harness + CamoFox) |
第一步:采集
用 CamoFox + Browser Harness 组合,让 Agent 自动采集目标平台的内容(如竞品动态、热点话题)。CamoFox 负责绕过反爬,Browser Harness 的 Domain Skills 直接提供对应平台的交互逻辑,不需要从头写选择器。
第二步:加工
采集到的内容通过 AiToEarn 的 AI 生成能力进行改写、扩写、生成配图。AiToEarn 内置 AI 内容生成,不需要单独调 LLM API。
第三步:发布
加工后的内容通过 AiToEarn 一次发布到多个平台。如果是通过 MCP 接口集成,甚至可以让 Claude/Cursor 一句话完成”采集→加工→发布”全流程。
5.2 MCP 集成路线
1 | // Claude Desktop config 示例 |
配置完成后,在 Claude 对话里就能直接调用:
1 | "用 AiToEarn 发布一篇关于 Browser Harness 的教程到小红书和 Twitter" |
5.3 选择建议
| 场景 | 推荐组合 |
|---|---|
| 纯内容发布 | AiToEarn 单独使用 |
| 需要采集/操作网页 | Browser Harness + AiToEarn |
| 反爬虫严格 | CamoFox + Browser Harness + AiToEarn |
| 全自动工作流 | 三件套 + MCP 集成 |
六、部署参考与总结
6.1 部署方式对比
| 方式 | 适用场景 | 复杂度 |
|---|---|---|
| Web 在线版 | 个人/轻量使用 | 最低 |
| Docker Compose | 团队/批量 | 低 |
| 源码构建 | 二次开发 | 高(Nx 构建问题) |
6.2 硬件参考
- AiToEarn:2 核 + 4~6 GB 内存
- Browser Harness:依赖 Chrome,资源占用与 Chrome 相当
- CamoFox:空闲 ~40MB,根据并发浏览器数量线性增长
6.3 注意事项
AiToEarn
- 源码部署存在 Nx monorepo 构建问题,优先 Docker
- 云电脑资源评估要打折扣,2 核可能实际不足
- Relay 模式是快速上手的捷径,但长期建议走自有 OAuth
Browser Harness
- 需要 Chrome 启用 remote debugging 端口
- 自进化写入的
agent_helpers.py是增量积累,初期函数少是正常的
CamoFox
- C++ 级伪装 ≠ 绝对不可检测,高安全目标的平台(如 Google 账号级检测)仍需人工介入
- VNC 可视化登录导出状态是处理复杂验证码的有效手段
- 通过 OpenClaw 插件方式集成最为方便
6.4 写在最后
三件套的分工非常清晰:AiToEarn 管发布、Browser Harness 管控制、CamoFox 管渗透。各自的功能边界明确,组合在一起能覆盖 AI 内容自动化的主要场景。
对于已经在用 AI Agent 做内容运营的团队,这套组合值得认真评估。特别适合的场景:多平台矩阵运营、竞品动态追踪、热点内容快速响应。
本文基于三份研究报告整理采写,所有技术细节均来自公开资料和项目文档。






