技术博客 全部文章

浏览 技术博客 分类下的公开文章、摘要与延伸阅读。肖恩子的知识花园

分类:技术博客排序:发表时间倒序
评估和测试智能体技能实用指南英文
3

评估和测试智能体技能实用指南

技术博客
作者: Philipp Schmid
发表时间

AI代理技能数量激增但多数未做评测且常由AI生成,文中给出落地评测方法:先量化成功标准,再用10–20条提示集驱动代理运行并以正则等确定性检查或LLM裁判评分持续迭代,案例通过改写触发描述与将警告改为明确指令把Gemini技能通过率从66.7%提升到100%,结论是用评测防止回退并据结果决定技能维护或退役。

从被动应对到主动出击:借助大语言模型弥合钓鱼攻击防御缺口英文
7

从被动应对到主动出击:借助大语言模型弥合钓鱼攻击防御缺口

技术博客
作者: Cloudflare
发表时间

Cloudflare将LLM接入邮件安全,实时细分海量恶意邮件并锁定“销售外联”式钓鱼,基于语义意图训练专用模型输出风险分数并与信誉等信号联动拦截且持续自我迭代,使防御从依赖用户事后上报转为提前发现盲区,Q4 2025相关漏报日均提交由965降至769并在2026年初继续大幅下降。

管理 Claude 的记忆英文
6

管理 Claude 的记忆

技术博客
作者: Anthropic
发表时间

Claude Code跨会话记忆分自动记忆与CLAUDE.md体系,启动时加载工作目录向上CLAUDE.md全量及MEMORY.md前200行,子目录内容按需读取且指令越具体优先级越高,用户可用/memory编辑并用设置或环境变量开关,CLAUDE.md支持@导入并可用.claude/rules按路径分模块定规则,使组织团队与个人偏好长期一致且可控。

在智能体投入生产之前,你根本不知道它会做什么英文
5

在智能体投入生产之前,你根本不知道它会做什么

技术博客
作者: LangChain
发表时间

智能体因自然语言输入无穷且对提示微变敏感、推理与工具链路不可预期,生产监控需从只看延迟错误转为追踪全对话、上下文与轨迹,并用标注队列引入结构化人工复核、用LLM在线评估与聚类洞察自动发现模式,最终形成可告警的质量与安全指标闭环以持续改进。

[教程] 为你的OpenClaw添加救援机器人 主机器人挂掉后可以快速自动救援中文
6

[教程] 为你的OpenClaw添加救援机器人 主机器人挂掉后可以快速自动救援

技术博客
作者: 蓝点网
发表时间

在同一服务器部署主机器人与救援机器人两套 OpenClaw 实例,主机故障时由救援机通过独立配置与密钥接管排障,自动查看主机日志与配置、修正错误并重启服务,减少手动 SSH 操作与恢复时间;可加装开机自启并按需授予更高权限以提升自动化,但需控制密钥暴露风险。

停止使用 /init 生成 AGENTS.md英文
8

停止使用 /init 生成 AGENTS.md

技术博客
作者: Addy Osmani
发表时间

研究对比显示AGENTS.md效果取决于内容:自动/init生成的概览多为可自行发现信息,导致噪声、成功率降2-3%且成本增20%+;人工仅写工具陷阱、隐性约定等不可发现信息可提效提准,应将其视为可随问题修复而删减的最小“异味清单”,并按目录分层按需加载以控成本与偏置。

Harness 工程:在以智能体为先的世界中利用 Codex英文
9

Harness 工程:在以智能体为先的世界中利用 Codex

技术博客
作者: OpenAI
发表时间

团队用Codex在无人工写码约束下5个月从空仓库交付内测产品,生成约百万行代码与1500次PR,耗时约手写的1/10;人类转为设计脚手架、文档地图、UI与可观测反馈回路并用lint强制架构与品味,使代理可端到端修复发布,但需以“黄金原则”定期清理漂移,长期一致性仍待验证。

Uber的限流系统英文

Uber的限流系统

技术博客
作者: Uber
发表时间

Uber在服务网格内推全局限流GRL,采用分层聚合由控制平面下发丢弃比例的概率限流取代Redis计数与令牌桶,并用RLC基于历史流量自动计算并更新配额,结果降低端到端延迟与运维成本、释放存储资源,在流量峰值与攻击下提升平台稳定性与公平性。

关于智能体框架与智能体可观测性英文
6

关于智能体框架与智能体可观测性

技术博客
作者: LangChain
发表时间

作者认为智能体框架不会消失但必须随模型能力同步演进,LangChain体系从链式调用到LangGraph运行时再到DeepAgents实现长任务规划与工具循环并按场景推荐使用;同时推出独立于各框架的LangSmith,通过追踪与评测提升调试监控与上线质量,结论是简单LLM请求可不必上框架但生产级必须具备可观测性。

OpenAI 智能体工程指南:10 条实战技巧和 3 种构建模式中文
2

OpenAI 智能体工程指南:10 条实战技巧和 3 种构建模式

技术博客
作者: 宝玉
发表时间

OpenAI 发布智能体工程手册,提出用Skills按需加载流程、Shell提供执行环境、Compaction自动压缩上下文,并用清晰技能描述与负面示例提升多技能路由可靠性,实测可支撑百万级token与多次工具调用的长期运行且促成跨厂商技能标准化。

每页显示 77
上一页 5 / 8 下一页