推出 GPT‑5.5

OpenAI于2026年4月23日发布GPT-5.5，称其为迄今最智能、最直观的模型，在代理编码、计算机使用、知识工作和科学研究等领域实现重大跃升。该模型在保持与GPT-5.4同等推理速度的同时显著提升智能水平，并以更强的安全防护措施向ChatGPT和Codex用户推出。

核心能力与效率提升: GPT-5.5擅长复杂多步骤任务，可自主规划、使用工具、检查工作并处理模糊性。在Terminal-Bench 2.0等编码基准测试中达到82.7%的最先进准确率，同时token效率显著提升，完成相同任务所需token大幅减少。
代理编码突破: 在SWE-Bench Pro达58.6%，Expert-SWE（中位人类完成时间20小时）超越GPT-5.4。早期测试者称其具备"概念清晰度"，能处理大规模系统重构、跨分支合并等复杂工程任务，被NVIDIA工程师形容为"失去它像截肢"。
知识工作与企业应用: OpenAI内部超85%员工每周使用Codex，涵盖财务（审查71,637页K-1税表加速两周）、通讯（自动化演讲请求处理）、市场（节省5-10小时/周报告生成）等职能。在GDPval（84.9%）、OSWorld-Verified（78.7%）等基准表现领先。
科学研究加速: 在GeneBench（25.0% vs 19.0%）、BixBench（80.5%）等生物信息学基准提升明显；内部版本协助发现Ramsey数新证明，被验证于Lean。免疫学教授Derya Unutmaz称基因表达分析工作从数月缩短至即时完成。
推理基础设施创新: 与NVIDIA GB200/GB300 NVL72系统协同设计，通过Codex分析生产流量模式优化负载均衡，token生成速度提升超20%。模型参与优化自身服务基础设施，形成"模型帮助改进服务模型的基础设施"的闭环。
网络安全与治理: 部署迄今最严格的安全防护，包括更严格的网络风险分类器、Trusted Access for Cyber计划（验证用户可获更少限制的防御性网络能力）。将生物/化学与网络安全能力评定为Preparedness Framework下的"高"级别，未达"临界"级别。
定价与可用性: ChatGPT Plus/Pro/Business/Enterprise及Codex用户即刻可用；API定价为输入 $5/百万token、输出$ 30/百万token，Pro版本输入 $30/百万token、输出$ 180/百万token。GPT-5.5 Pro面向Pro及以上用户，Fast模式速度提升1.5倍、成本2.5倍。

推出 GPT‑5.5

内容

评论

摘要