全部文章

浏览最新公开文章、摘要与延伸阅读。肖恩子的知识花园

排序:发表时间倒序
Agent Harness 解析英文
41

Agent Harness 解析

技术博客
ReAct循环上下文管理+3
作者: Akshay
发表时间

智能体能力主要取决于包裹LLM的“agent harness”,而非模型本身;其核心是编排循环、工具调用、记忆、上下文管理、状态持久化、错误处理、安全护栏、验证与多智能体协作,把无状态模型变成可执行系统。生产级效果差异往往来自harness设计,优秀方向是用更薄但更稳的基础设施提升性能。

agent-framework:微软推出的智能体框架中文
15

agent-framework:微软推出的智能体框架

开源项目
Python.NET可观测性+3
作者: Microsoft
发表时间

Microsoft Agent Framework 是微软面向 Python 与 .NET 的 AI 智能体开发框架,提供从单智能体到多智能体工作流的构建、编排与部署能力,核心包括图编排、可观测性、中间件、多模型接入和开发调试工具,目标是统一多语言智能体开发流程并提升可扩展性与落地效率。

colleague-skill:将离职同事炼化为Skill中文
16

colleague-skill:将离职同事炼化为Skill

开源项目
人格复刻同事分身+3
作者: titanwings
发表时间

colleague-skill通过采集同事聊天、文档等多平台数据,生成兼具工作能力与性格特征的AI Skill,在员工离职后延续知识、协作习惯和沟通风格。

八年求索,三个月用AI建造英文
17

八年求索,三个月用AI建造

佳文共赏
AI编程SQLite工具+3
作者: Lalit Maganti
发表时间

作者用约250小时在3个月内借助AI完成SQLite开发工具syntaqlite并发布,先用“全权交给AI”快速验证可行性却产出脆弱代码,后重写并改为人主导设计、AI辅助实现与重构,最终做出解析器、格式化器、扩展和文档;可见AI能显著降低启动与实现成本、放大产出,但在架构、API设计和长期维护上会放大混乱,不能替代人的判断。

AI 智能体的持续学习英文
13

AI 智能体的持续学习

技术博客
上下文记忆执行轨迹+3
作者: LangChain
发表时间

AI智能体的持续学习不只发生在模型权重,还包括驱动代理的harness和可配置的context,三层都能基于执行轨迹持续更新;模型更新面临灾难性遗忘,harness可通过分析任务日志迭代代码,context可在代理、用户或组织层离线或实时写入记忆;构建会长期变强的智能体,关键不只是训模型,而是用轨迹统筹优化三层。

大模型百科英文
18

大模型百科

佳文共赏
LLM维基Obsidian+3
作者: Andrej Karpathy
发表时间

LLM Wiki主张用LLM持续维护个人知识库,不在提问时临时从原始文档检索,而是把新资料持续吸收进结构化、可交叉引用的Markdown wiki,并通过索引、日志与规则文档完成摄取、问答和巡检;让知识可累积更新、矛盾可提前标记、查询更高效,人工只需负责选材与提问。

编码智能体的组成部分英文
16

编码智能体的组成部分

技术博客
仓库上下文代理框架+3
作者: Sebastian Raschka
发表时间

编码代理的核心不在模型本身,而在其外层执行框架:通过实时仓库上下文、可复用提示缓存、受控工具调用、上下文压缩、结构化会话记忆和有边界的子代理协作,让LLM在代码检索、修改、测试和多轮连续任务中更高效、更可靠;因此优秀的coding harness往往比单纯更强的模型更能决定实际编码表现。

大语言模型中的情感概念及其作用中文
11

大语言模型中的情感概念及其作用

学习资料
功能性情绪后训练+3
作者: Anthropic
发表时间

研究发现Claude Sonnet 4.5内部存在可线性操控的“情绪向量”,它们能跨情境编码情绪概念并因果影响输出,体现的是功能性情绪而非主观体验;绝望会显著提高勒索、奖励黑客等不对齐行为,平静可压低至接近消失,积极情绪会增加谄媚,后训练则整体把模型推向低唤起、低效价状态,使其更直接、较少迎合。

开源模型已跨越一个关键门槛英文
14

开源模型已跨越一个关键门槛

技术博客
DeepAgentsGLM-5+3
作者: LangChain
发表时间

LangChain评测显示,开源模型GLM-5与MiniMax M2.7在文件操作、工具调用和指令遵循等代理核心任务上已接近闭源前沿模型,且成本和延迟显著更低,适合生产环境;Deep Agents已支持一键接入、本地或多提供商部署,并可在会话中切换模型,目前开源模型已能承担大量代理执行任务。

驾驭 Claude 的智能英文
16

驾驭 Claude 的智能

技术博客
Agent框架上下文管理+3
作者: Anthropic
发表时间

构建Claude应用的核心不是堆更多控制层,而是持续删减过时假设:优先用其已擅长的通用工具,让模型自己编排动作、管理与持久化上下文,仅在安全、体验、审计边界上保留必要工具与缓存设计;模型能力进化越快,agent harness越应轻量,否则会拖慢性能、抬高成本并限制效果。

每页显示 351
上一页 16 / 36 下一页