凌晨王炸:GPT-5.5 正式上线

2026 年 4 月 23 日,OpenAI 正式发布 GPT-5.5,这是其时隔七周继 GPT-5.4(2026 年 3 月 5 日发布)之后的最新模型升级。官方将其定位为「面向真实工作的新一代智能(a new class of intelligence for real work)」。

与以往大模型升级通常伴随延迟增加不同,GPT-5.5 在实现显著智能提升的同时,保持了与 GPT-5.4 相当的每秒 token 处理速度,并大幅减少了完成任务所需的 token 数量——更聪明,也更高效。

核心升级:Agent 能力是最大亮点

GPT-5.5 的核心突破体现在四个关键领域:

  • Agentic Coding:自主编程能力大幅提升,能够在复杂代码库中自主规划、调试、跨文件修改
  • Computer Use:计算机操作能力增强,可接管屏幕、点击、输入、跨工具协作
  • Knowledge Work:知识工作效率质变,可处理研究、信息综合、文档生成等复杂工作流
  • Early Scientific Research:科学研究辅助能力初现,支持前沿数学、生物等领域的探索性研究

官方表示,GPT-5.5「能更快理解你的意图,并承担更多工作本身」,支持多步骤复杂任务规划、工具调用、结果验证的完整闭环。

基准测试:多项指标领先竞品

OpenAI 公布了 GPT-5.5 在多项行业基准测试中的成绩:

基准测试 GPT-5.5 GPT-5.4 Claude Opus 4.7 Gemini 3.1 Pro
Terminal-Bench 2.0 82.7% 75.1% 69.4% 68.5%
OSWorld-Verified 78.7% 75.0% 78.0% -
CyberGym 81.8% 79.0% 73.1% -
FrontierMath Tier 4 35.4% 27.1% 22.9% 16.7%
GDPval 84.9% 83.0% 80.3% 67.3%

在 Terminal-Bench(复杂命令行工作流测试)中,GPT-5.5 以 82.7% 的准确率创下 SOTA;在 SWE-Bench Pro(真实 GitHub Issue 解决率)中达到 58.6%,单次通过率超越以往所有模型。

真实用户评价:「失去 GPT-5.5 像被截肢」

官方博客引述了多位早期测试者的反馈,措辞颇为震撼:

  • Dan Shipper(Every CEO):「这是第一款让我感受到真正概念清晰度的编程模型。」 他测试用 GPT-5.5 重新处理此前需要顶级工程师介入才能解决的系统重写问题,GPT-5.4 无法完成,GPT-5.5 一步到位。

  • NVIDIA 工程师「失去 GPT-5.5 的访问权限,感觉像被截肢了一样。」

  • Michael Truell(Cursor CEO):「GPT-5.5 比 GPT-5.4 明显更聪明、更持久,编码性能更强,工具使用更可靠。它能在复杂、长时长的任务上坚持更久不中途放弃。」

  • Pietro Schirano(MagicPath CEO):GPT-5.5 一次性解决了包含数百个前端和重构变更的分支合并,耗时约 20 分钟。

定价:比 GPT-5.4 贵一倍,但用到的 token 更少

GPT-5.5 的 API 定价是 GPT-5.4 的两倍:

GPT-5.5 GPT-5.4
输入(1M tokens) $5.00 $2.50
缓存输入(1M tokens) $0.50 $0.25
输出(1M tokens) $30.00 $15.00

OpenAI 表示:「虽然 GPT-5.5 定价比 GPT-5.4 高,但它更智能且 token 效率更高。在 Codex 中,我们精心调校后,大多数用户使用 GPT-5.5 反而比 GPT-5.4 消耗更少 token。」

可用范围:ChatGPT 和 Codex 今日同步推送

GPT-5.5 已于发布当日逐步推送给以下用户:

  • ChatGPT:GPT-5.5 Thinking 已向 Plus、Pro、Business、Enterprise 用户开放;GPT-5.5 Pro(更高难度任务版)向 Pro、Business、Enterprise 用户开放
  • Codex:向 Plus、Pro、Business、Enterprise、Edu、Go 计划用户开放,上下文窗口达 400K;Fast 模式生成速度提升 1.5 倍,价格为标准模式的 2.5 倍
  • API:即将推出(需要额外安全评估)

一点感慨

这可能是最接近「AI 原生工作流」愿景的一次发布。GPT-5.5 的核心突破不是某一个单项指标,而是让模型真正理解「工作的形状」——为什么失败、该在哪里修、会影响哪些周边代码

引用那位 NVIDIA 工程师的话:「失去 GPT-5.5 像被截肢。」 对于真正依赖 AI 辅助编程的开发者来说,这或许是最好的口碑认证。


即刻体验 GPT-5.5:MonkeyCode 平台 GPT-5.5 秒上线,凌晨刚刚发布!网速这一块无敌了:立刻体验官方发布公告