Agnes AI:新加坡「价格屠夫」凭什么让三大核心模型全线免费?
2026 年 6 月 1 日,一家低调的新加坡 AI 公司扔下一枚重磅炸弹:旗下三大核心模型 API,无限期免费开放。在 OpenAI、Anthropic 纷纷涨价的当下,这家公司想干什么? Agnes AI 是谁?如果你对 Agnes AI 感到陌生,并不奇怪。这家公司没有硅谷的炫目光环,也没有 DeepSeek 那样的破圈式引爆。但它的一组数据足以让行业侧目: 全球排名:Artificial Analysis 全球 AI Lab 第 9 名 全球用户:超 800 万,覆盖 180+ 国家 ARR:接近 2000 万美元 估值:超 1 亿美元(2025 年底) 所属实体:Sapiens AI(新加坡),关联南京开为网络科技有限公司(2016 年成立,国家高新技术企业) 从数据来看,Agnes AI 已经是一家在增长、营收、技术排名三个维度都站得住脚的 AI 公司——只是它太低调了。 创始人:一个有”执念”的技术理想主义者Bruce Yang(杨通)的履历堪称标准的”精英模板”: 新加坡莱佛士中学(顶尖中学) 加州大学伯克利分校,数学与计算机双学位,师从图灵奖得主 ...
限时免费试用!天工SkyClaw Agent模型半价享顶级性能
原文来源:36氪 - 限时免费试用!天工SkyClaw Agent模型半价享顶级性能 5月26日,昆仑万维旗下天工 AI 正式推出高性能 Agent 模型 SkyClaw-v1.0,并同步发布轻量化版本 SkyClaw-v1.0-lite,兼具顶尖性能与极致性价比。 SkyClaw-v1.0 支持百万token上下文,深度适配各类真实智能体工作场景,重点优化复杂工具调用、多轮任务执行、代码生成、文件编辑、交互式应用构建与研究型数据分析。模型经过大规模 mid-train、高质量合成任务 SFT 与端到端强化学习优化,可在 OpenClaw、Hermes、Nanobot 等主流 Agent 环境中运行,同时适配 Claude Code、Codex 等代码 Agent 框架,通用性与兼容性拉满。 Agent 模型和 Agent framework 的组合,正在改变模型的使用方式。过去,模型主要回答问题;现在,模型被放进一个能读取仓库、调用工具、编辑文件、运行测试、观察反馈的执行环境里,开始承担完整工作流。SkyClaw-v1.0 针对的正是这个阶段:让模型在长上下文和工具环境中持续...
AI 2.0 时代,你为人机共创做好准备了吗?
自 AI 诞生之初,人类科学家便试图让机器模仿人类的思维,以期铺就通往 AGI(通用人工智能)的道路。 AI 1.0 时代:有问必答的智能助手AI 1.0 时代,它对普通人最大的价值,或许只是提供情绪慰藉——一个永远在线、有问必答的智能伙伴。那时候的 AI 更像一位耐心的陪练,安静、可靠,但还远谈不上变革。 AI 2.0 时代:真正的爆发AI 2.0 时代的真正爆发,源自 Agent(智能体)时代的到来。这宛如 Web 2.0 时代的降临:人们从二维文本的浅滩,跃入多姿多彩的多媒体海洋。 Agent 时代正是 AI 时代的 Web 2.0 版本。 在这个周期里: 昨日新知的墨迹未干,下周或许便已泛黄过时。 知识与工具的产出,正如新一轮的宇宙大爆炸——密集、迅猛、目不暇接。 OpenClaw 作为 Agent 框架的代表之一,正在成为这场大爆炸的核心引信之一。它让普通人也能以极低的门槛搭起自己的智能体工作流,技术平权从未如此触手可及。 🦁 与巨兽共生面对这般变迁,迷茫与焦虑在所难免。 回望百年前的马车时代,或是上一个互联网浪潮,总有一群人在焦虑中彷徨。但换个角度看——...
当内存与显存合二为一:为什么统一内存是 AI Agent 时代的基础设施革命
2026年5月25日,「观妙-AGI&Agent研讨会」群聊摘录,基于弈韬与群友的真实讨论延伸采写。 一、一个换电脑的问题,引发了一场架构讨论故事从一个朴素的需求开始。 广州的群友说,笔记本装的东西越来越多,扛不住了,考虑换台式机。深圳的弈韬脱口而出: 「换统一内存的机器。」 对方一头雾水:「啥意思?NAT?」 于是弈韬在群里现场开了一堂微型架构课——从内存和显存的分工说起,到统一内存的工作原理,再到为什么这是 AGI Agent 时代的必然选择。一条讨论串不知不觉延续了十几条,信息密度极高。 二、传统架构的隐疾:永远有一个角色在「围观」要理解统一内存为什么重要,首先要理解传统 PC 架构里的那个结构性浪费。 内存 vs 显存——两个老死不相往来的兄弟传统 PC 的存储体系是这样的: 内存(RAM):容量大、速度快,用来跑程序、存数据。你开 Chrome 吃掉的几十 GB 都在这里。 显存(VRAM):容量小、速度快,专门给 GPU 跑图形和 AI 计算。 问题是,两者互不相通,绝不共享。内存满了就是满了,显存再空着也帮不上忙;显存满了,内存再富余也没法给...
这款开源插件,号称解决了openclaw和hermes的金鱼记忆问题!
一、痛点:Agent 的”金鱼记忆”你让 AI Agent 帮你看一份文档、写一段代码、查个资料,它回答得头头是道。但半小时后,当同一批上下文出现在新 session 里——之前的判断、中间结论、偏好取舍,一概清零。 这就是 Agent 的”金鱼记忆”:当前 session 内的上下文窗口再长,session 一关,一切归零。 传统应对手段是”上下文拉满”——把所有历史塞进 System Prompt。问题是: Token 成本线性增长 噪音越积越多,信号越压越弱 可读性归零:十万字日志,谁看得懂 问题的核心不是”存不下来”,而是”存了之后找不到、用不了、还贵”。 二、核心理念:分层 + 符号化我们的方案不追求”全量存”,而是做两件事: 分层:按价值密度将记忆分成 L0–L3 四层,低层密集检索、高层语义抽象 符号化:用 Mermaid 图、关系表、语义标签替代自然语言日志,让机器快检索、让人一眼可读 这和传统向量方案的差异很清晰: 维度 传统向量方案 分层符号化 存储粒度 chunk × N 条向量 4 层语义金字塔 检索方式 语义相似度 topK 分层...
这个赛博菩萨每天送你三千万!
AGENT 时代全面来临,三大运营商推出 TOKEN 套餐! 1️⃣ 运营商的 TOKEN 套餐到底是啥?最近三大运营商(移动、联通、电信)都推出了 TOKEN 套餐——把原本只有云服务才用的计费单元搬到手机话费账单里。听起来很高大上,实际上 价格和流量根本不匹配。 以江苏移动为例: 月费 40 元 套餐里标的只有 2000 万 TOKEN 换算下来,1 TOKEN 只值 0.02 元,也就是说 1000 元只能买到 5 万 TOKEN。 这么贵的”流量”,到底是市场需要,还是随便敲定的?很多人已经在社交媒体吐槽:这简直是拍脑袋决定的产物。 小提示:如果你只是想玩玩大模型,却不想被高额 TOKEN 账单逼到墙角,下面的方案更划算。 2️⃣ 赛博菩萨——MonkeyCode 的每日免费 TOKEN我平时用的 VibeCoding(MonkeyCode AI) 平台,每天都会 免费发放 3000 万 TOKEN 给所有免费用户。关键是,这些 TOKEN 可以直接调动一线大模型,包括我亲自跑了两个月的 qwen3.5-plus。 直观对比 项目 运营商套餐(江苏移动)...
Marvis vs QClaw:腾讯两款 AI 助手,同属一个舰队但走不同路线
2026 年 5 月,腾讯在同一条产品线上同时亮出了两款 AI 助手:Marvis(马维斯)和QClaw(小龙虾)。 名字听着像兄弟,实际上还真是同门——腾讯内部称为”龙虾特攻队”产品矩阵,两家团队分别来自应用宝和电脑管家,各出奇招。 但如果你仔细对比两者的设计思路,会发现一个很有意思的现象:它们几乎在同一时间回答了同一个问题——“AI 助手到底应该长什么样?”——而给出的答案完全不同。 一、Marvis:操作系统层级的 AI 助手Marvis 由腾讯应用宝团队打造,产品负责人王秋阳,业务负责人蔡建涛。2026 年 5 月 20 日正式上线,Windows、Mac、安卓三端可用,iOS 版本预计 6 月中旬推出。 核心定位:操作系统层级的 AI 助手。 说白了,Marvis 想要做的是把电脑变成一个可对话的智能终端。你不需要打开某个 App,不需要记住快捷键,直接用自然语言跟操作系统对话——“帮我整理桌面”、”把这张图传到云盘”、”帮我对比这两个文件”,Marvis 可以直接操控文件系统、系统设置、已安装 App。 它走的是系统级深度整合路线: 文件层面:理解文件内容、批量重...
2026年5月20日 AI 情报简报:Google I/O 引爆搜索革命,Agent 时代全面到来
2026 年 5 月 20 日,AI 行业迎来一场密度极高的信息爆发。Google I/O 2026 用一场 keynote 改写了搜索、多模态和 Agent 三个维度的游戏规则;与此同时,Anthropic、Meta、AWS、xAI 和 DeepSeek 在同一周密集出手,Agent 从”概念演示”加速走向”产品落地”。 今天是 AI 发展史上的一个分水岭节点。 一、Google I/O:搜索框 25 年最大重构Google 把用了 25 年的搜索框换掉了。 新的搜索体验叫 “Ask Google”——不再是输入关键词、等待蓝色链接列表,而是一个支持文本、图像、文件、语音的多模态对话入口。AI Mode 月活突破 10 亿,搜索量创历史新高。 这意味着什么? 关键词匹配 → 对话式智能,不只是交互形式的改变,而是搜索引擎商业模式的底层切换。广告主、SEO 从业者、内容创作者——整个搜索生态都需要重新思考。 与此同时,Google 在同一天发布了三款产品,形成完整矩阵: Gemini 3.5 Flash:打破”智能模型必须昂贵”的行业铁律,企业推理成本可削...
13 个模型大 PK,780 局厮杀!到底谁最牛逼?
摘要:名字一个比一个能打?拉出来比一比才知道。13 个模型,780 局五子棋,全程 AI 自己下自己赢,没有人工操盘。 MonkeyCode 里内置的大模型越来越多,我们发现一个很现实的问题:模型的名字一个比一个能打,用户打开列表以后经常陷入沉思——这个强吗?那个适合写代码吗?我今天到底该选谁? 所以我们就决定整点直观的。 光看参数、榜单、宣传页都太抽象。模型厉害不厉害,拉出来比一比。 于是就有了这场 AI 五子棋竞标赛。 为什么是五子棋?规则简单,大家都能看懂:黑白轮流下,谁先连成五个谁赢。没有复杂术语,没有隐藏规则,输了也没法说”我这是战略性试探”。 同时五子棋又刚好适合考模型能力:它需要看局势、算威胁、做取舍,还得在回合制里一步一步推理。对 AI 来说,这比”请你夸夸我”要真实多了。 01 参赛模型这次比赛一共有 13 个模型参赛: 模型 定位 gpt-5.5 当前榜首热门选手 gpt-5.4 稳定强力通用模型 gpt-5.4-mini 轻量版速度型选手 gpt-5.3-codex 代码场景专用选手 qwen3.5-plus 通义高性能旗舰...
AiToEarn + Browser Harness + CamoFox:AI 内容自动化三件套实战
最近在研究 AI Agent 的内容自动化能力,顺手把三个紧密相关的开源工具串了起来。这篇是实用教程,不讲空泛的概念,每个工具讲清楚:它是什么、为什么值得用、怎么上手。 一、三件套概览三件套解决的问题不同,但组合起来能覆盖”内容采集 → 浏览器操作 → 多平台分发”的完整链路: 工具 核心定位 解决的问题 AiToEarn AI 内容分发平台 一键把内容发布到 12+ 个社交媒体 Browser Harness CDP 浏览器控制框架 让 LLM Agent 直接操控 Chrome CamoFox 反检测浏览器 AI Agent 绕过反爬虫,稳定访问各平台 三者组合后的能力:让 Agent 自动完成”采集→处理→发布”全流程。 二、AiToEarn:AI 驱动的多平台内容分发2.1 它是什么AiToEarn 是一个 AI 驱动的内容分发平台,核心卖点是一键把内容同步到多个社交媒体。国内支持抖音、小红书、B站、快手、视频号、微信公众号;国际支持 TikTok、YouTube、Facebook、Instagram、Threads、Twitter、Pinte...










