8
Harness Engineering — Agent 不好用,也许不是模型的问题
技术博客
作者: Chaofa Yuan
发表时间:
Harness指模型权重外的一切系统设计,涵盖提示、上下文、工具、沙箱、中间件与子代理等,其核心不是反复改prompt,而是改环境让错误难以再发生;实验证明同一模型仅优化自检、环境注入、死循环检测和推理强度调度,成绩可从Top30升至Top5;结论是Agent可靠性主要取决于Harness,持久价值在缓存、存储、隔离等受物理约束的设计。
浏览作者 Chaofa Yuan 的公开文章、摘要与延伸阅读。肖恩子的知识花园
Harness指模型权重外的一切系统设计,涵盖提示、上下文、工具、沙箱、中间件与子代理等,其核心不是反复改prompt,而是改环境让错误难以再发生;实验证明同一模型仅优化自检、环境注入、死循环检测和推理强度调度,成绩可从Top30升至Top5;结论是Agent可靠性主要取决于Harness,持久价值在缓存、存储、隔离等受物理约束的设计。