中文面向长周期任务的适配智能学习体上下文管理
AdaCoM用外部小型LLM为冻结Agent学习上下文删改、合并与压缩策略,缓解长任务中的上下文退化,无需训练闭源Agent;实验显示网页搜索平均相对提升39.0%,深度研究中Kimi、DeepSeek分别提升9.0%和22.3%,核心结论是强Agent适合保留较长高保真上下文,弱Agent需激进压缩,且策略可在能力相近Agent间迁移复用。
浏览最新公开文章、摘要与延伸阅读。肖恩子的知识花园
中文AdaCoM用外部小型LLM为冻结Agent学习上下文删改、合并与压缩策略,缓解长任务中的上下文退化,无需训练闭源Agent;实验显示网页搜索平均相对提升39.0%,深度研究中Kimi、DeepSeek分别提升9.0%和22.3%,核心结论是强Agent适合保留较长高保真上下文,弱Agent需激进压缩,且策略可在能力相近Agent间迁移复用。
英文Perplexity推出Search as Code架构,将搜索栈拆成可由模型生成代码调用的SDK原语,并在安全沙箱中完成检索、排序、过滤、并行和聚合,使智能体能为复杂任务动态构建搜索流程;评测显示SaC在五项基准中四项领先,WANDR领先次优系统2.5倍,同时降低成本和上下文噪声,推动搜索从固定接口转向可编程智能体基础设施。
中文Ed Zitron认为AI行业已陷入由OpenAI、Anthropic、NVIDIA、云巨头和风投共同维持的泡沫,核心矛盾是算力承诺、GPU销售、数据中心建设和真实收入之间数学上无法闭合;需求主要由少数AI公司和云厂商互相投喂制造,企业ROI不清、用户增长和利润率恶化,一旦数据中心融资放缓或OpenAI、Anthropic增速不达预期,将引发GPU减值、债务违约、云厂商收入缺口、供应链崩溃和风投清算,结论是AI泡沫不是是否破裂,而是何时以何种方式爆炸。
中文Aether 是用于稳定复用视觉风格的 Codex 插件,可把参考图、提示词想法和生成结果沉淀为视觉记忆,后续自动召回风格、光影、色彩、构图、氛围、角色和负面规则来精修提示词,并根据新素材决定新建、归类、变体或合并,形成可演进素材库;它还记录生成结果、一致性检查和反馈,帮助持续复用有效经验、减少偏差,适合长期保持图片创作风格一致。
中文LLM Sleep提出在上下文窗口满后暂停输入,执行多次离线递归前向传播,用学习规则更新SSM快速权重,再清空KV缓存继续预测;其核心判断是长上下文失败主要源于被驱逐信息缺乏足够计算转化,而非内存容量不足。实验显示睡眠循环越多,Rule 110、Depo多跳检索、GSM-Infinite和滑动窗口任务的深度推理表现越好,收益集中在难例;代价是训练成本随循环深度线性上升且更不稳定。
中文使用 Codex 回溯近30天会话、记忆与纪事,识别重复、高成本、可复用的工作流程,优先复用现有技能、子代理或自动化,只为高置信度缺口创建最小资产,并输出候选短名单、创建结果、跳过项及需更多证据的事项,避免推测、重叠和宽泛封装。能有效沉淀有用技能、子代理或自动化。
英文现代AI并非复制人类智能,也不是简单统计工具,而是学习并延展沉淀在人类语言中的认知结构,因此能生成流畅文本、代码和推理,却因缺乏与现实世界的直接经验而容易幻觉、组合推理失败、视觉理解脆弱。AI风险不在于其拥有自主意图,而在于无责任地放大未扎根现实的模式,可信AI必须依赖人类设计的治理、评估、审计和安全约束。
中文DeepSeek-Reasonix是面向DeepSeek优化的开源终端AI编码智能体框架,以前缀缓存稳定性为核心,通过缓存优先循环、工具调用修复和成本控制降低长会话token开销,支持CLI、桌面端、QQ频道、MCP、技能与记忆系统。