英文顾问策略:为智能体提升智能水平
Anthropic推出Claude平台advisor工具,将Opus作为顾问、Sonnet或Haiku作为执行器接入同一API请求,由执行器在遇到难题时调用Opus给出计划或纠偏,避免全程使用高成本模型;测试显示该方案在多项基准上提升成绩并降低单任务成本,Sonnet+Opus接近Opus级智能而成本更接近Sonnet,适合追求性能与成本平衡的智能体开发。
浏览 业界资讯 分类下的公开文章、摘要与延伸阅读。肖恩子的知识花园
英文Anthropic推出Claude平台advisor工具,将Opus作为顾问、Sonnet或Haiku作为执行器接入同一API请求,由执行器在遇到难题时调用Opus给出计划或纠偏,避免全程使用高成本模型;测试显示该方案在多项基准上提升成绩并降低单任务成本,Sonnet+Opus接近Opus级智能而成本更接近Sonnet,适合追求性能与成本平衡的智能体开发。
英文Meta发布首个Muse系列模型Muse Spark,主打原生多模态推理、工具调用、视觉思维链和多智能体协作,并上线Contemplating模式提升复杂任务表现,现已在meta.ai和App开放、API小范围预览;其训练与推理栈完成重构,算力效率和扩展性显著提升,安全评估显示当前部署风险处于可控范围,目标是推进个人超级智能。
中文Anthropic称Claude Mythos Preview为其最强模型,能力较前代大幅提升,尤其可自主发现并利用零日漏洞;因双重用途和潜在错位风险,官方决定不向公众发布,仅限少数伙伴用于防御性网络安全,结论是模型进步快于安全机制,当前虽总体低风险,但未来更强系统的失控隐患上升。
英文GLM-5.1是面向代理式工程的新旗舰模型,编码与复杂软件任务能力显著强于GLM-5,在SWE-Bench Pro取得领先,并在仓库生成、终端任务和长期优化中持续改进,能通过数百轮迭代自主拆解问题、实验和修正策略,将向量数据库性能提升至21.5k QPS、GPU任务提速3.6倍。这次核心突破不只是首轮表现更强,而是长时程自主优化能力明显增强。
英文Cirrus Labs创始团队宣布并入OpenAI的Agent Infrastructure团队,把原先为云时代工程师打造工具与环境的使命延伸到人类与智能体工程;受此影响,公司将开放并放宽Tart等工具许可并取消授权收费,停止接受Cirrus Runners新客户,Cirrus CI于2026年6月1日关闭。
英文Chrome推出两项提效功能:用户可右键开启垂直选项卡,将标签移至侧边以更清晰查看标题并更高效管理多标签;也可右键启用阅读模式,去除网页干扰并以全文界面专注阅读,整体作用是简化浏览操作、减少分心、提升多任务与阅读效率。
中文OpenClaw 2026.4.5 新增实验性 Dreaming 后台记忆整合系统,需手动启用,按 Light、Deep、REM 三阶段将短期信号筛选、评分并沉淀为长期记忆,其中仅 Deep 会写入 MEMORY.md,同时生成可审查的状态与报告文件,让记忆管理更可解释、可追踪。
中文Cursor 3发布为面向智能体编程的统一工作区,重构界面以集中管理多工作区、多代码仓库及本地云端智能体,支持并行协作、跨端接力、差异审查到PR管理,并保留IDE、浏览器和插件能力,目标是减少工具切换与人工调度,推动软件开发向更自主、持续交付的智能体模式演进。