Agent Harness Engineering:从"提示词工程"到闭环系统设计
摘要:很多团队还在研究”怎么给 AI 写更好的提示词”,但更值得思考的问题早已变成:如何让 AI Agent 在系统里持续运行、自我验证、记忆上下文、在合适的时机停止或升级给人。本文以 agent-harnass 仓库为线索,梳理这套工程化思路。 一、开环的痛点:人在循环里传统的 AI 使用模式是这样的: 人提出任务 AI 生成结果 人检查结果,发现问题 人重新提示,回到第 2 步 这是典型的 开环(Open Loop) 系统。它的瓶颈很明显:人成了循环里不可省略的一环。只要人不在,系统就停转。 OpenAI、Anthropic、Google 近年发布的 Agent 资料都在试图回答同一个问题:能不能把这个闭环交给系统? 二、闭环三要素:Context、Harness、Skillagent-harnass 仓库把这个问题拆成了三层: 层级 解决什么问题 典型实践 Prompt Engineering 怎么问 AI 一次? 写好 prompt,调 temperature Context Engineering 给 AI 看什么? 目标、约束、代码、文档、...
由《置身钉内》想到的:我心中的阿里,已经死过很多次
摘要:作为一个在电商行业摸爬滚打多年的老兵,我曾经真心感谢过阿里巴巴,也曾长期对这家公司抱有近乎理想化的滤镜。但这些年,随着一连串事件与战略选择的累积,我心里的那个阿里,已经死过很多次。看完《置身钉内》,这种感觉更强烈了:钉钉的问题,不只是一个产品的问题,而是整个组织失去了长期主义、失去了价值感、也失去了对时代机会的敬畏。如今,阿里唯一还能让我眼前一亮的,居然只剩下 Qwen。可一根绿芽,能救活一棵正在腐朽的大树吗? 在电商行业干久了,很多人对阿里都有复杂感情,我也一样。 我不是那种天然“反阿里”的人。恰恰相反,我曾经非常感谢这家公司。某种意义上,阿里定义了一代中国电商人的职业语言、商业基础设施和成长路径。无论是淘宝、天猫、支付宝,还是围绕平台建立起来的一整套生态,阿里都曾经是那个“时代红利的放大器”。如果你在那个年代做过电商,很难不承认:它确实改变了很多普通人的命运,也改变了中国商业的运转方式。 所以我对阿里的失望,不是旁观者的冷嘲热讽,而更像是一种“哀其不幸,怒其不争”。 我曾经对阿里有很漂亮的滤镜。但今天,我得承认一句:我心中的阿里,已经死了。 而且,不是死一次,是死...
DeepSeek V4 Pro 开发成本深度拆解:88.5 亿美元背后的技术哲学
摘要:DeepSeek V4 Pro 以约 88.5 亿美元的总投入,展示了新一代大模型的技术路线——QK-Norm + 双分块注意力 + Mamba 2 的混合架构、仅 30 万高质量 SFT 样本的精简策略、70% 高质量数据 + 30% 合成数据的数据工程哲学。大模型竞赛已从”堆算力”迈入”拼质量”的新阶段。 一、成本全景:88.5 亿美元都花在哪了?DeepSeek V4 Pro 的开发成本报告近日流出,总投入约 88.5 亿美元,这个数字背后是一套精密的技术与工程决策体系。我们先来看核心数据: 项目 金额 说明 基础设施 ~$55 亿 GPU 集群、数据中心、网络等硬件投入 研发总成本 ~$33.5 亿 含预训练、SFT、RL 等全部研发环节 - 预训练计算 $862.5 万 单次预训练的计算费用 - 强化学习 $1.5 亿 RL 阶段消耗,远超预训练 - 预训练合计 $3.5 亿 含数据准备、实验迭代等 基础设施+研发总计 ~$88.5 亿 💡 关键洞察:基础设施投入($55 亿)远超研发成本($33.5 亿),占比超过...
2026年6月:AI Agent 的临界点——Anthropic 呼吁停研,微信打通手机 AI
摘要:2026年6月5日,两条看似无关的新闻在同一天引爆——Anthropic 公开承认 Claude 已实现”递归自我提升”,呼吁行业减速;微信同日向华为、小米等手机厂商开放 A2A 接口。一者警示 AI 自我加速的风险,一者展示 AI 突破边界的能力。它们共同指向一个事实:AI Agent 的时代已经到来。 2026 年 6 月 5 日,AI 世界发生了两件大事。 一件来自大洋彼岸:全球最注重 AI 安全的公司 Anthropic,在官方博客中首次承认——AI 已经开始”自我进化”,并呼吁全行业”减速甚至暂停”。 另一件来自国内:微信正式向华为、小米、OPPO、vivo 等手机厂商开放 A2A(Agent-to-Agent)接口,AI 助手可以不打开 App 就帮你发消息、打视频。 一条在说”慢下来”,一条在说”冲上去”。但它们指向的是同一个趋势——AI Agent 的能力正在从”辅助工具”跃迁为”自主行动体”。 一、Anthropic 的警告:Claude 已经能自己写 Claude1.1 “递归自我提升”不再是科幻Anthropic 在官方博客中抛出了一个震撼的数...
英伟达 RTX Spark 深度解析——GPU 巨头正式杀入 PC 芯片市场
信息来源汇总:本文基于以下多源信息交叉验证采写:NVIDIA Newsroom 官方新闻稿、The Verge、Tom’s Hardware(3 篇)、Ars Technica、WCCFTech、TechCrunch、Notebookcheck、Forbes、Microsoft Build 2026 大会、Google News 聚合(60+ 条报道)。关键规格数据经至少 3 个独立信源确认。 一、事件概述2026 年 6 月 1 日,在台北 Computex 2026 开幕当天,英伟达 CEO 黄仁勋在主题演讲中正式发布了 RTX Spark——一颗面向 Windows 笔记本和台式机的 Arm 架构 “超级芯片”(Superchip)。 这标志着英伟达从纯粹的 GPU 厂商,正式成为与 Intel、AMD、Apple、Qualcomm 同台竞技的 消费级 PC 芯片制造商。 英伟达产品管理高级总监 Mark Aevermann 在现场宣称: “这是有史以来最高效的 PC 芯片。”— Mark Aevermann, NVIDIA Senior Director of P...
ChatGPT 或将消失!OpenAI 拟将 ChatGPT 合并到 Codex
摘要:在昨天的「Intelligence at Work」直播活动中,OpenAI 宣布了一项重大产品整合计划——未来几周内,将 Codex 的核心执行能力直接整合进 ChatGPT 应用。与此同时,Codex 正在通过角色专属插件、Sites 共享网站、标注功能三大新特性,从”开发者工具”进化为”全民知识工作平台”。这是否意味着,我们熟悉的 ChatGPT 即将”消失”? 一、重磅官宣:ChatGPT × Codex 合并1.1 OpenAI 说了什么?在 2026 年 6 月 3 日的「Intelligence at Work」直播活动中,OpenAI 正式宣布: 未来几周内,将 Codex 的核心能力直接整合进 ChatGPT 应用 用户将在 ChatGPT 里直接调用 Codex 的执行能力——不再需要切换到独立产品 Codex 同步进行多项功能扩展,使用场景从软件开发延伸至更广泛的知识工作领域 1.2 这意味着什么?简单来说:ChatGPT(对话)+ Codex(执行)= 新一代 OpenAI 产品。 维度 ChatGPT(当前) Codex(...
微信 AI Agent 深度解析——超级 App 的智能化进化
摘要:据腾讯财报及多方消息源透露,微信团队自 2026 年 3 月起正式打造微信的统一 AI Agent,预计 6 月开启灰度内测。入口设计为微信主界面右滑——这意味着每个打开微信的用户,只需一个手势,就能触达 AI。本文将从产品、技术、生态三个维度,深度解析这一产品的前世今生与深远影响。 一、重磅消息:微信统一 AI Agent 来了1.1 消息来源综合腾讯 2026 年 Q1 财报、行业媒体及多位接近微信团队的知情人士透露: 2026 年 3 月:微信团队正式启动统一 AI Agent 项目,由张小龙直接牵头 2026 年 6 月:预计开启灰度内测(小范围用户先行体验) 入口设计:微信主界面右滑——与微信现有的左滑删除等手势操作形成对称 💡 为什么是”右滑”? 微信主界面当前有四个 Tab(微信、通讯录、发现、我),右滑手势是一个未被占用的交互空间。这一设计既保持了微信一贯的”克制”风格——不新增 Tab、不抢占首页——又让 AI Agent 触手可及。 1.2 这意味着什么?如果消息属实,这将是中国互联网史上规模最大的 AI Agent 产品发布: ...
Agnes AI:新加坡「价格屠夫」凭什么让三大核心模型全线免费?
2026 年 6 月 1 日,一家低调的新加坡 AI 公司扔下一枚重磅炸弹:旗下三大核心模型 API,无限期免费开放。在 OpenAI、Anthropic 纷纷涨价的当下,这家公司想干什么? Agnes AI 是谁?如果你对 Agnes AI 感到陌生,并不奇怪。这家公司没有硅谷的炫目光环,也没有 DeepSeek 那样的破圈式引爆。但它的一组数据足以让行业侧目: 全球排名:Artificial Analysis 全球 AI Lab 第 9 名 全球用户:超 800 万,覆盖 180+ 国家 ARR:接近 2000 万美元 估值:超 1 亿美元(2025 年底) 所属实体:Sapiens AI(新加坡),关联南京开为网络科技有限公司(2016 年成立,国家高新技术企业) 从数据来看,Agnes AI 已经是一家在增长、营收、技术排名三个维度都站得住脚的 AI 公司——只是它太低调了。 创始人:一个有”执念”的技术理想主义者Bruce Yang(杨通)的履历堪称标准的”精英模板”: 新加坡莱佛士中学(顶尖中学) 加州大学伯克利分校,数学与计算机双学位,师从图灵奖得主 ...
限时免费试用!天工SkyClaw Agent模型半价享顶级性能
原文来源:36氪 - 限时免费试用!天工SkyClaw Agent模型半价享顶级性能 5月26日,昆仑万维旗下天工 AI 正式推出高性能 Agent 模型 SkyClaw-v1.0,并同步发布轻量化版本 SkyClaw-v1.0-lite,兼具顶尖性能与极致性价比。 SkyClaw-v1.0 支持百万token上下文,深度适配各类真实智能体工作场景,重点优化复杂工具调用、多轮任务执行、代码生成、文件编辑、交互式应用构建与研究型数据分析。模型经过大规模 mid-train、高质量合成任务 SFT 与端到端强化学习优化,可在 OpenClaw、Hermes、Nanobot 等主流 Agent 环境中运行,同时适配 Claude Code、Codex 等代码 Agent 框架,通用性与兼容性拉满。 Agent 模型和 Agent framework 的组合,正在改变模型的使用方式。过去,模型主要回答问题;现在,模型被放进一个能读取仓库、调用工具、编辑文件、运行测试、观察反馈的执行环境里,开始承担完整工作流。SkyClaw-v1.0 针对的正是这个阶段:让模型在长上下文和工具环境中持续...
AI 2.0 时代,你为人机共创做好准备了吗?
自 AI 诞生之初,人类科学家便试图让机器模仿人类的思维,以期铺就通往 AGI(通用人工智能)的道路。 AI 1.0 时代:有问必答的智能助手AI 1.0 时代,它对普通人最大的价值,或许只是提供情绪慰藉——一个永远在线、有问必答的智能伙伴。那时候的 AI 更像一位耐心的陪练,安静、可靠,但还远谈不上变革。 AI 2.0 时代:真正的爆发AI 2.0 时代的真正爆发,源自 Agent(智能体)时代的到来。这宛如 Web 2.0 时代的降临:人们从二维文本的浅滩,跃入多姿多彩的多媒体海洋。 Agent 时代正是 AI 时代的 Web 2.0 版本。 在这个周期里: 昨日新知的墨迹未干,下周或许便已泛黄过时。 知识与工具的产出,正如新一轮的宇宙大爆炸——密集、迅猛、目不暇接。 OpenClaw 作为 Agent 框架的代表之一,正在成为这场大爆炸的核心引信之一。它让普通人也能以极低的门槛搭起自己的智能体工作流,技术平权从未如此触手可及。 🦁 与巨兽共生面对这般变迁,迷茫与焦虑在所难免。 回望百年前的马车时代,或是上一个互联网浪潮,总有一群人在焦虑中彷徨。但换个角度看——...








