分类:技术博客作者:Manthan Gupta排序:发表时间倒序

技术博客 全部文章

浏览 技术博客 分类下的公开文章、摘要与延伸阅读。肖恩子的知识花园

分类:技术博客作者:Manthan Gupta排序:发表时间倒序
语音智能体中的记忆问题比你想象的更难英文
31

语音智能体中的记忆问题比你想象的更难

技术博客
会话事实低延迟+3
作者: Manthan Gupta
发表时间

语音智能体的记忆不能沿用文本架构,500至800毫秒响应预算下,同步向量检索和实时总结会破坏对话节奏;可行方案是反转读写路径:通话前预加载用户画像、上次摘要和未结事项,通话中只查热缓存,语义检索和事实写入异步执行,通话后总结并在空闲期整合,最终记忆质量取决于预先准备和筛选,而非临场检索能力。

语音代理入门:让 AI 开口说话的底层架构英文
23

语音代理入门:让 AI 开口说话的底层架构

技术博客
VAD检测全双工+3
作者: Manthan Gupta
发表时间

语音代理不是给LLM加语音,而是受延迟约束的STT、LLM、TTS流水线;生产主流仍是可观测的级联架构,需用流式、全双工、打断检测和轮次管理把响应压到500至800毫秒内,否则体验会显得机械或失效。

记忆可能正在损害你的AI产品英文
11

记忆可能正在损害你的AI产品

技术博客
AI记忆上下文膨胀+3
作者: Manthan Gupta
发表时间

AI产品把记忆当默认卖点,但作者认为它本质是高成本的产品与系统税:常导致答案被旧偏好锚定、上下文膨胀、调试更难,并放大隐私泄露与安全投毒风险。多数场景应先做显式配置、工作流状态和任务级检索,只有长期连续型产品才值得谨慎引入记忆。

我研读了 Hermes Agent 的记忆系统,它弥补了 OpenClaw 的设计缺陷英文
9

我研读了 Hermes Agent 的记忆系统,它弥补了 OpenClaw 的设计缺陷

技术博客
作者: Manthan Gupta
发表时间

Hermes采用四层记忆架构,小型MEMORY.md和USER.md保存稳定高价值事实,SQLite会话库按需检索历史,Skills沉淀可复用流程,Honcho可选扩展深层用户建模;其关键动作是冻结系统提示、把大部分记忆转移到工具检索,并在压缩上下文前先提炼持久信息,结果是在控制成本与缓存稳定性的同时保持连续性与实用性。

Clawdbot 如何记住一切英文
6

Clawdbot 如何记住一切

技术博客
作者: Manthan Gupta
发表时间

Clawdbot是MIT开源本地个人AI助手,集成Discord等并可自动处理邮件日程等任务,核心用Markdown持久记忆配SQLite向量与全文索引,回答前语义加关键词混合检索并在会话压缩前静默写入防丢,多代理记忆隔离,结果是上下文长期可追溯且由用户本机掌控并降低调用成本。

每页显示 5
上一页 1 / 1 下一页