中文推出 Composer 2
Composer 2 已在 Cursor 上线,编程能力较前代显著提升,在 CursorBench、Terminal-Bench 2.0 和 SWE-bench Multilingual 等基准全面刷新成绩,并通过持续预训练与强化学习增强长周期复杂任务处理能力,定价为每百万输入 token 2.50,另有更快版本 7.50,整体形成高智能、低成本的新默认选择。
浏览 业界资讯 分类下的公开文章、摘要与延伸阅读。肖恩子的知识花园
中文Composer 2 已在 Cursor 上线,编程能力较前代显著提升,在 CursorBench、Terminal-Bench 2.0 和 SWE-bench Multilingual 等基准全面刷新成绩,并通过持续预训练与强化学习增强长周期复杂任务处理能力,定价为每百万输入 token 2.50,另有更快版本 7.50,整体形成高智能、低成本的新默认选择。
英文Cloudflare将Workers AI升级为智能体全生命周期平台,接入开源大模型Kimi K2.5,支持256k上下文、工具调用、视觉和结构化输出,并配套前缀缓存、会话亲和与重构异步API;其内部实测在保证质量下比专有模型更快更省,单用例成本降77%,结论是开源大模型正成为可规模化部署智能体的更优选择。
中文ACM 将2025年图灵奖授予 Charles H. Bennett 与 Gilles Brassard,表彰其提出BB84量子密钥分发、量子隐形传态与纠缠蒸馏等奠基性成果,推动安全通信与量子网络发展,使加密可由物理定律保障并具抗量子攻击能力,进一步加速量子信息科学走向量子互联网与容错量子计算。
英文Stitch正升级为AI原生软件设计画布,用户可用自然语言、语音、图片、文本或代码生成并迭代高保真UI,在无限画布上借助设计代理、多方案管理、交互原型和设计系统复用快速协作,并通过MCP、SDK及导出衔接开发工具,最终把想法到可用产品的周期从数天压缩到数分钟。
中文智谱发布基座模型GLM-5-Turbo,面向开源智能体龙虾重构训练,重点提升工具调用、复杂任务拆解、长时运行和高吞吐执行,解决长链路任务失速问题;盲测中实战表现居前,并已适配硬件与企业安全体系,推动AI从辅助工具走向可落地的数字劳动力。
英文Codex支持按需并行生成子代理处理复杂任务,并汇总结果输出,用户还可为不同任务自定义代理的模型配置与指令;该能力当前默认可用,已在应用和CLI中显示、IDE扩展即将支持,但仅在明确要求时触发,代价是比单代理消耗更多tokens。
中文OpenAI发布GPT‑5.4 mini与nano,两者主打高吞吐、低延迟和低成本;mini较GPT‑5 mini在代码、推理、多模态和工具调用上明显增强,速度翻倍且多项评测接近GPT‑5.4,适合代码助手与计算机使用场景;nano则面向分类、提取、排序等轻任务,现已分别在API、Codex和ChatGPT等渠道上线。
英文langgraph-cli新增deploy命令集,核心命令langgraph deploy可一键将LangGraph代理部署到LangSmith Deployment并接入现有CI/CD;执行时自动构建Docker镜像、创建运行所需基础设施并配置Postgres与Redis,实现免手工搭建的生产级运行;同时提供list、logs、delete等管理命令与新代理模板,可用uvx快速启用。
中文腾讯电脑管家18.0推出“龙虾管家·AI安全沙箱”,以沙箱隔离限制本地AI智能体底层资源与敏感权限访问,拦截异常支付和系统文件修改,实时监测提示词与技能包并阻断注入攻击,提供剪贴板、摄像头、麦克风等调用可视化追踪,已支持OpenClaw、QClaw等框架,推动PC防护升级为AI行为审计与合规管控。
中文OpenClaw发布2026.3.7核心版,新增上下文引擎插件化、分布式频道持久绑定与本地流式输出优化,原生支持GPT-5.4并深度优化Gemini3.1;配合lossless-claw长上下文理解得分74.8超越竞品,项目正从实验框架走向可持久可扩展的生产级智能体操作系统,并加速被部署为低成本虚拟员工。