中文5
面向长周期任务的适配智能学习体上下文管理
学习资料
AdaCoMGRPO+3
作者: Lu Yi等
发表时间:
AdaCoM用外部小型LLM为冻结Agent学习上下文删改、合并与压缩策略,缓解长任务中的上下文退化,无需训练闭源Agent;实验显示网页搜索平均相对提升39.0%,深度研究中Kimi、DeepSeek分别提升9.0%和22.3%,核心结论是强Agent适合保留较长高保真上下文,弱Agent需激进压缩,且策略可在能力相近Agent间迁移复用。
浏览 学习资料 分类下的公开文章、摘要与延伸阅读。肖恩子的知识花园
中文AdaCoM用外部小型LLM为冻结Agent学习上下文删改、合并与压缩策略,缓解长任务中的上下文退化,无需训练闭源Agent;实验显示网页搜索平均相对提升39.0%,深度研究中Kimi、DeepSeek分别提升9.0%和22.3%,核心结论是强Agent适合保留较长高保真上下文,弱Agent需激进压缩,且策略可在能力相近Agent间迁移复用。