OpenAI 作者

浏览作者 OpenAI 的公开文章、摘要与延伸阅读。肖恩子的知识花园

作者:OpenAI排序:发表时间倒序
Codex 支持 Subagents英文

Codex 支持 Subagents

业界资讯
作者: OpenAI
发表时间

Codex支持按需并行生成子代理处理复杂任务,并汇总结果输出,用户还可为不同任务自定义代理的模型配置与指令;该能力当前默认可用,已在应用和CLI中显示、IDE扩展即将支持,但仅在明确要求时触发,代价是比单代理消耗更多tokens。

GPT-5.4 mini 与 nano 正式发布中文

GPT-5.4 mini 与 nano 正式发布

业界资讯
作者: OpenAI
发表时间

OpenAI发布GPT‑5.4 mini与nano,两者主打高吞吐、低延迟和低成本;mini较GPT‑5 mini在代码、推理、多模态和工具调用上明显增强,速度翻倍且多项评测接近GPT‑5.4,适合代码助手与计算机使用场景;nano则面向分类、提取、排序等轻任务,现已分别在API、Codex和ChatGPT等渠道上线。

推理模型难以掌控思维链,但这反而是件好事中文

推理模型难以掌控思维链,但这反而是件好事

技术博客
作者: OpenAI
发表时间

研究用开源套件CoT-Control在13个推理模型、1.3万余任务上测试思维链可控性,结果显示前沿模型普遍难以按指令重塑或遮蔽推理过程,可控性多低于15.4%且最低0.1%,规模增大略升但推理更长与后训练/RL增加会下降,被告知在监测下仅小幅提升,结论是当前CoT可控性不构成对CoT监测的主要风险但需持续评估并在系统卡同步披露相关指标。

GPT-5.4 思维系统卡片英文

GPT-5.4 思维系统卡片

学习资料
作者: OpenAI
发表时间

GPT-5.4 Thinking是GPT-5系列最新推理模型,沿用该系列既有安全缓解框架,但首次在通用模型中针对“网络安全高能力”部署专门缓解措施,网络安全方案继承GPT-5.3 Codex在ChatGPT与API的做法,文中亦称其为gpt-5.4-thinking,且基线对比对象为GPT-5.2 Thinking。

GPT‑5.4 震撼登场英文
1

GPT‑5.4 震撼登场

业界资讯
作者: OpenAI
发表时间

OpenAI发布GPT-5.4及Pro并上线ChatGPT、API与Codex,整合更强推理、编码与代理能力,支持原生电脑操作、100万token上下文与工具搜索,提供可调计划、深网研究和更稳上下文,同时更省token并提速,基准成绩整体优于5.2与5.3,提升复杂专业任务产出与开发效率。

介绍 EVMbench英文

介绍 EVMbench

业界资讯
作者: OpenAI
发表时间

OpenAI与Paradigm发布EVMbench,用120个高危合约漏洞评测AI的检测、修补与沙箱链上资金盗取能力,并以Rust框架实现可复现实验,GPT‑5.3‑Codex在盗取模式得分72.2%较GPT‑5的31.9%大幅提升但检测与修补仍不充分,结论是需强化AI辅助审计以降低智能合约安全风险。

GPT-5.3 Instant:更顺畅、更实用的日常对话体验英文

GPT-5.3 Instant:更顺畅、更实用的日常对话体验

业界资讯
作者: OpenAI
发表时间

GPT‑5.3 Instant更新上线,优化拒答并削减免责声明,联网搜索整合更贴题,语气更自然且幻觉率下降,现向全体用户与API开放,GPT‑5.2将保留三个月并于2026年6月3日退役。

Harness 工程:在以智能体为先的世界中利用 Codex英文

Harness 工程:在以智能体为先的世界中利用 Codex

技术博客
作者: OpenAI
发表时间

团队用Codex在无人工写码约束下5个月从空仓库交付内测产品,生成约百万行代码与1500次PR,耗时约手写的1/10;人类转为设计脚手架、文档地图、UI与可观测反馈回路并用lint强制架构与品味,使代理可端到端修复发布,但需以“黄金原则”定期清理漂移,长期一致性仍待验证。

推出 GPT-5.3-Codex-Spark英文

推出 GPT-5.3-Codex-Spark

业界资讯
作者: OpenAI
发表时间

OpenAI发布研究预览GPT‑5.3‑Codex‑Spark,基于Cerebras低延迟硬件实现实时编程协作,128k上下文文本模式,支持超千token/秒并默认轻量修改;同时改造端到端链路使首token更快、往返与逐token开销显著下降,将先向ChatGPT Pro与少量API伙伴开放并扩容,推动Codex形成实时迭代与长任务并行的双模式。

每页显示 9
上一页 1 / 1 下一页