内容

OpenAI于2026年4月23日发布GPT-5.5,称其为迄今最智能、最直观的模型,在代理编码、计算机使用、知识工作和科学研究等领域实现重大跃升。该模型在保持与GPT-5.4同等推理速度的同时显著提升智能水平,并以更强的安全防护措施向ChatGPT和Codex用户推出。

  • 核心能力与效率提升: GPT-5.5擅长复杂多步骤任务,可自主规划、使用工具、检查工作并处理模糊性。在Terminal-Bench 2.0等编码基准测试中达到82.7%的最先进准确率,同时token效率显著提升,完成相同任务所需token大幅减少。

  • 代理编码突破: 在SWE-Bench Pro达58.6%,Expert-SWE(中位人类完成时间20小时)超越GPT-5.4。早期测试者称其具备"概念清晰度",能处理大规模系统重构、跨分支合并等复杂工程任务,被NVIDIA工程师形容为"失去它像截肢"。

  • 知识工作与企业应用: OpenAI内部超85%员工每周使用Codex,涵盖财务(审查71,637页K-1税表加速两周)、通讯(自动化演讲请求处理)、市场(节省5-10小时/周报告生成)等职能。在GDPval(84.9%)、OSWorld-Verified(78.7%)等基准表现领先。

  • 科学研究加速: 在GeneBench(25.0% vs 19.0%)、BixBench(80.5%)等生物信息学基准提升明显;内部版本协助发现Ramsey数新证明,被验证于Lean。免疫学教授Derya Unutmaz称基因表达分析工作从数月缩短至即时完成。

  • 推理基础设施创新: 与NVIDIA GB200/GB300 NVL72系统协同设计,通过Codex分析生产流量模式优化负载均衡,token生成速度提升超20%。模型参与优化自身服务基础设施,形成"模型帮助改进服务模型的基础设施"的闭环。

  • 网络安全与治理: 部署迄今最严格的安全防护,包括更严格的网络风险分类器、Trusted Access for Cyber计划(验证用户可获更少限制的防御性网络能力)。将生物/化学与网络安全能力评定为Preparedness Framework下的"高"级别,未达"临界"级别。

  • 定价与可用性: ChatGPT Plus/Pro/Business/Enterprise及Codex用户即刻可用;API定价为输入5/百万token、输出5/百万token、输出30/百万token,Pro版本输入30/百万token、输出30/百万token、输出180/百万token。GPT-5.5 Pro面向Pro及以上用户,Fast模式速度提升1.5倍、成本2.5倍。

评论

(0)
未配置登录方式
暂无评论