英文GLM-5.1:迈向长时程任务
GLM-5.1是面向代理式工程的新旗舰模型,编码与复杂软件任务能力显著强于GLM-5,在SWE-Bench Pro取得领先,并在仓库生成、终端任务和长期优化中持续改进,能通过数百轮迭代自主拆解问题、实验和修正策略,将向量数据库性能提升至21.5k QPS、GPU任务提速3.6倍。这次核心突破不只是首轮表现更强,而是长时程自主优化能力明显增强。
浏览最新公开文章、摘要与延伸阅读。肖恩子的知识花园
英文GLM-5.1是面向代理式工程的新旗舰模型,编码与复杂软件任务能力显著强于GLM-5,在SWE-Bench Pro取得领先,并在仓库生成、终端任务和长期优化中持续改进,能通过数百轮迭代自主拆解问题、实验和修正策略,将向量数据库性能提升至21.5k QPS、GPU任务提速3.6倍。这次核心突破不只是首轮表现更强,而是长时程自主优化能力明显增强。
中文MyMemory是基于欧盟、联合国及多语言网站数据构建的全球大型翻译记忆库,提供100多种语言的文本、文档和语音翻译,并通过用户修正、投票和新增译文持续扩充数据,已积累超96亿条人工贡献,形成兼具大规模语料、实时质量反馈和专业翻译服务支撑的翻译平台。
英文Cirrus Labs创始团队宣布并入OpenAI的Agent Infrastructure团队,把原先为云时代工程师打造工具与环境的使命延伸到人类与智能体工程;受此影响,公司将开放并放宽Tart等工具许可并取消授权收费,停止接受Cirrus Runners新客户,Cirrus CI于2026年6月1日关闭。
中文QMD是本地文档搜索引擎,可为Markdown笔记、会议记录和文档库建立索引,结合BM25、向量语义搜索与LLM重排序,并通过智能分块、查询扩展、RRF融合和位置感知评分提升结果质量,同时提供MCP服务器供AI Agent接入,最终实现无需云端依赖的本地高质量关键词与自然语言检索。
中文MemPalace是开源本地AI记忆系统,以wing、hall、room等结构组织对话与项目数据,结合AAAK无损压缩和时序知识图谱,用极少上下文完成高效检索与动态事实验证,检索效果较纯语义搜索提升34%,在LongMemEval上以零API、本地免费方案取得96.6% R@5,性能超过多款付费记忆系统。
中文OpenAI推出Codex插件,让Claude Code直接调用Codex进行代码审查、任务委托和后台作业管理,支持常规审查、对抗性审查、任务救援与进度追踪,复用本地CLI配置和认证无需单独账户,并可通过审查门自动拦截问题响应,最终实现Claude与Codex的无缝协作与更高效开发流程。
英文Chrome推出两项提效功能:用户可右键开启垂直选项卡,将标签移至侧边以更清晰查看标题并更高效管理多标签;也可右键启用阅读模式,去除网页干扰并以全文界面专注阅读,整体作用是简化浏览操作、减少分心、提升多任务与阅读效率。
中文文章将LLM界定为基于统计预测的文本生成器而非真正智能,其关键问题是会稳定产出貌似合理却可能失真的内容,能力边界混乱、易被微小输入操纵且难验证。推论出AI只适合低风险、易核查任务,若用于医疗、法律、信息传播和自动化决策,将放大技术债、权力集中、网络污染、欺诈与心理伤害。
中文OpenClaw 2026.4.5 新增实验性 Dreaming 后台记忆整合系统,需手动启用,按 Light、Deep、REM 三阶段将短期信号筛选、评分并沉淀为长期记忆,其中仅 Deep 会写入 MEMORY.md,同时生成可审查的状态与报告文件,让记忆管理更可解释、可追踪。