GPT-5.5 正式发布:智能与效率兼得的 Agent 时代引擎
凌晨王炸:GPT-5.5 正式上线
2026 年 4 月 23 日,OpenAI 正式发布 GPT-5.5,这是其时隔七周继 GPT-5.4(2026 年 3 月 5 日发布)之后的最新模型升级。官方将其定位为「面向真实工作的新一代智能(a new class of intelligence for real work)」。
与以往大模型升级通常伴随延迟增加不同,GPT-5.5 在实现显著智能提升的同时,保持了与 GPT-5.4 相当的每秒 token 处理速度,并大幅减少了完成任务所需的 token 数量——更聪明,也更高效。
核心升级:Agent 能力是最大亮点
GPT-5.5 的核心突破体现在四个关键领域:
- Agentic Coding:自主编程能力大幅提升,能够在复杂代码库中自主规划、调试、跨文件修改
- Computer Use:计算机操作能力增强,可接管屏幕、点击、输入、跨工具协作
- Knowledge Work:知识工作效率质变,可处理研究、信息综合、文档生成等复杂工作流
- Early Scientific Research:科学研究辅助能力初现,支持前沿数学、生物等领域的探索性研究
官方表示,GPT-5.5「能更快理解你的意图,并承担更多工作本身」,支持多步骤复杂任务规划、工具调用、结果验证的完整闭环。
基准测试:多项指标领先竞品
OpenAI 公布了 GPT-5.5 在多项行业基准测试中的成绩:
| 基准测试 | GPT-5.5 | GPT-5.4 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|---|
| Terminal-Bench 2.0 | 82.7% | 75.1% | 69.4% | 68.5% |
| OSWorld-Verified | 78.7% | 75.0% | 78.0% | - |
| CyberGym | 81.8% | 79.0% | 73.1% | - |
| FrontierMath Tier 4 | 35.4% | 27.1% | 22.9% | 16.7% |
| GDPval | 84.9% | 83.0% | 80.3% | 67.3% |
在 Terminal-Bench(复杂命令行工作流测试)中,GPT-5.5 以 82.7% 的准确率创下 SOTA;在 SWE-Bench Pro(真实 GitHub Issue 解决率)中达到 58.6%,单次通过率超越以往所有模型。
真实用户评价:「失去 GPT-5.5 像被截肢」
官方博客引述了多位早期测试者的反馈,措辞颇为震撼:
Dan Shipper(Every CEO):「这是第一款让我感受到真正概念清晰度的编程模型。」 他测试用 GPT-5.5 重新处理此前需要顶级工程师介入才能解决的系统重写问题,GPT-5.4 无法完成,GPT-5.5 一步到位。
NVIDIA 工程师:「失去 GPT-5.5 的访问权限,感觉像被截肢了一样。」
Michael Truell(Cursor CEO):「GPT-5.5 比 GPT-5.4 明显更聪明、更持久,编码性能更强,工具使用更可靠。它能在复杂、长时长的任务上坚持更久不中途放弃。」
Pietro Schirano(MagicPath CEO):GPT-5.5 一次性解决了包含数百个前端和重构变更的分支合并,耗时约 20 分钟。
定价:比 GPT-5.4 贵一倍,但用到的 token 更少
GPT-5.5 的 API 定价是 GPT-5.4 的两倍:
| GPT-5.5 | GPT-5.4 | |
|---|---|---|
| 输入(1M tokens) | $5.00 | $2.50 |
| 缓存输入(1M tokens) | $0.50 | $0.25 |
| 输出(1M tokens) | $30.00 | $15.00 |
OpenAI 表示:「虽然 GPT-5.5 定价比 GPT-5.4 高,但它更智能且 token 效率更高。在 Codex 中,我们精心调校后,大多数用户使用 GPT-5.5 反而比 GPT-5.4 消耗更少 token。」
可用范围:ChatGPT 和 Codex 今日同步推送
GPT-5.5 已于发布当日逐步推送给以下用户:
- ChatGPT:GPT-5.5 Thinking 已向 Plus、Pro、Business、Enterprise 用户开放;GPT-5.5 Pro(更高难度任务版)向 Pro、Business、Enterprise 用户开放
- Codex:向 Plus、Pro、Business、Enterprise、Edu、Go 计划用户开放,上下文窗口达 400K;Fast 模式生成速度提升 1.5 倍,价格为标准模式的 2.5 倍
- API:即将推出(需要额外安全评估)
一点感慨
这可能是最接近「AI 原生工作流」愿景的一次发布。GPT-5.5 的核心突破不是某一个单项指标,而是让模型真正理解「工作的形状」——为什么失败、该在哪里修、会影响哪些周边代码。
引用那位 NVIDIA 工程师的话:「失去 GPT-5.5 像被截肢。」 对于真正依赖 AI 辅助编程的开发者来说,这或许是最好的口碑认证。
即刻体验 GPT-5.5:MonkeyCode 平台 GPT-5.5 秒上线,凌晨刚刚发布!网速这一块无敌了:立刻体验|官方发布公告






