Philipp Schmid 作者

浏览作者 Philipp Schmid 的公开文章、摘要与延伸阅读。肖恩子的知识花园

作者:Philipp Schmid排序:发表时间倒序
评估和测试智能体技能实用指南英文

评估和测试智能体技能实用指南

技术博客
作者: Philipp Schmid
发表时间

AI代理技能数量激增但多数未做评测且常由AI生成,文中给出落地评测方法:先量化成功标准,再用10–20条提示集驱动代理运行并以正则等确定性检查或LLM裁判评分持续迭代,案例通过改写触发描述与将警告改为明确指令把Gemini技能通过率从66.7%提升到100%,结论是用评测防止回退并据结果决定技能维护或退役。

每页显示 1
上一页 1 / 1 下一页