分类:技术博客作者:LangChain排序:发表时间倒序

技术博客 全部文章

浏览 技术博客 分类下的公开文章、摘要与延伸阅读。肖恩子的知识花园

分类:技术博客作者:LangChain排序:发表时间倒序
AI 智能体的持续学习英文
5

AI 智能体的持续学习

技术博客
上下文记忆执行轨迹+3
作者: LangChain
发表时间

AI智能体的持续学习不只发生在模型权重,还包括驱动代理的harness和可配置的context,三层都能基于执行轨迹持续更新;模型更新面临灾难性遗忘,harness可通过分析任务日志迭代代码,context可在代理、用户或组织层离线或实时写入记忆;构建会长期变强的智能体,关键不只是训模型,而是用轨迹统筹优化三层。

开源模型已跨越一个关键门槛英文
10

开源模型已跨越一个关键门槛

技术博客
DeepAgentsGLM-5+3
作者: LangChain
发表时间

LangChain评测显示,开源模型GLM-5与MiniMax M2.7在文件操作、工具调用和指令遵循等代理核心任务上已接近闭源前沿模型,且成本和延迟显著更低,适合生产环境;Deep Agents已支持一键接入、本地或多提供商部署,并可在会话中切换模型,目前开源模型已能承担大量代理执行任务。

自主上下文压缩英文
6

自主上下文压缩

技术博客
作者: LangChain
发表时间

Deep Agents在Python SDK与CLI新增“自主上下文压缩”工具,模型可在任务边界、提炼结论前后、读取或生成大量内容及进入复杂多步流程时主动触发,将旧消息按规则总结并保留最近约10%对话,以缓解上下文窗口限制与context rot,减少固定阈值压缩带来的时机不佳并提升长程交互代理的稳定性与可用性。

智能体框架的深层剖析英文
8

智能体框架的深层剖析

技术博客
作者: LangChain
发表时间

Agent由模型与Harness组成,Harness指除模型外的代码与执行机制,通过提供持久状态、文件系统与Git、工具与代码执行、沙箱环境、搜索与记忆注入、上下文压缩与输出卸载、规划与自验证循环及编排钩子,把仅能输入输出文本的模型变成可长期自主完成任务的工作引擎,并与模型后训练共同演化但也可能导致对特定工具逻辑过拟合,因此优化Harness本身可显著改变同一模型的效果。

评估 Skills英文
4

评估 Skills

技术博客
作者: LangChain
发表时间

LangChain为Codex、Claude Code等编码代理构建按需加载的技能,并提出评测管线:在一致沙箱中设定可度量任务,对比无技能与不同拆分技能的表现,用LangSmith全程追踪行动与失败原因并迭代,结果任务完成率由9%升至82%,结论是技能必须依赖系统化评测与可观测性才能稳定增益。

在智能体投入生产之前,你根本不知道它会做什么英文
5

在智能体投入生产之前,你根本不知道它会做什么

技术博客
作者: LangChain
发表时间

智能体因自然语言输入无穷且对提示微变敏感、推理与工具链路不可预期,生产监控需从只看延迟错误转为追踪全对话、上下文与轨迹,并用标注队列引入结构化人工复核、用LLM在线评估与聚类洞察自动发现模式,最终形成可告警的质量与安全指标闭环以持续改进。

关于智能体框架与智能体可观测性英文
6

关于智能体框架与智能体可观测性

技术博客
作者: LangChain
发表时间

作者认为智能体框架不会消失但必须随模型能力同步演进,LangChain体系从链式调用到LangGraph运行时再到DeepAgents实现长任务规划与工具循环并按场景推荐使用;同时推出独立于各框架的LangSmith,通过追踪与评测提升调试监控与上线质量,结论是简单LLM请求可不必上框架但生产级必须具备可观测性。

智能体如何将文件系统用于上下文构建英文
3

智能体如何将文件系统用于上下文构建

技术博客
作者: LangChain
发表时间

Deep Agents让代理通过文件系统读写、编辑、搜索文件,把工具返回的大段内容、任务计划和技能指令写入并按需用grep/glob回读,缓解上下文窗口与token膨胀、提升冷门信息检索与多步执行可靠性,并可在用户反馈后更新自身指令实现持续学习。

每页显示 8
上一页 1 / 1 下一页