技术博客 全部文章

浏览 技术博客 分类下的公开文章、摘要与延伸阅读。肖恩子的知识花园

分类:技术博客排序:发表时间倒序
Claude Code 在大型代码库中的使用:最佳实践与入门指南英文
54

Claude Code 在大型代码库中的使用:最佳实践与入门指南

技术博客
LSP集成MCP服务+3
作者: Anthropic
发表时间

Claude Code在大型代码库落地的关键不在模型本身,而在围绕代码库建立可导航、可维护、可治理的配置体系:用分层CLAUDE.md提供上下文,配合hooks、skills、plugins、LSP、MCP和subagents提升检索、执行与分发效率,并由专人或团队持续维护规则和治理;组织若提前建设基础设施、控制上下文噪音、定期更新配置,采用效果和规模化速度显著提升。

语音智能体中的记忆问题比你想象的更难英文
31

语音智能体中的记忆问题比你想象的更难

技术博客
会话事实低延迟+3
作者: Manthan Gupta
发表时间

语音智能体的记忆不能沿用文本架构,500至800毫秒响应预算下,同步向量检索和实时总结会破坏对话节奏;可行方案是反转读写路径:通话前预加载用户画像、上次摘要和未结事项,通话中只查热缓存,语义检索和事实写入异步执行,通话后总结并在空闲期整合,最终记忆质量取决于预先准备和筛选,而非临场检索能力。

使用Claude Code:HTML的超凡有效性英文
35

使用Claude Code:HTML的超凡有效性

技术博客
ClaudeHTML+3
作者: Thariq
发表时间

作者主张在 Claude Code 中用 HTML 取代 Markdown 作为主要输出格式,因为 HTML 能承载表格、SVG、交互、布局和可视化,更适合复杂规格、代码审查、设计原型、研究报告和一次性编辑器;代价是生成更慢、版本 diff 更差,但可读性、分享性和参与感更强,能让人更有效审阅并指导 AI 工作。

语音代理入门:让 AI 开口说话的底层架构英文
23

语音代理入门:让 AI 开口说话的底层架构

技术博客
VAD检测全双工+3
作者: Manthan Gupta
发表时间

语音代理不是给LLM加语音,而是受延迟约束的STT、LLM、TTS流水线;生产主流仍是可观测的级联架构,需用流式、全双工、打断检测和轮次管理把响应压到500至800毫秒内,否则体验会显得机械或失效。

长期运行的智能体英文
36

长期运行的智能体

技术博客
Ralph循环会话日志+3
作者: Addy Osmani
发表时间

长运行智能体的核心不是更长对话,而是把状态、计划、进度和验证移出上下文窗口,使其能跨多会话、多沙箱持续工作、失败恢复并继续推进;主流方案已收敛为规划、执行、评估分工,加会话日志、记忆层和检查点,影响是AI开始能稳定承担数小时到数周的开发、运维和研究任务,但成本、安全、漂移与验收仍是主要瓶颈。

我把 22 号端口开放在公网上长达 54 天,看看都有哪些“访客”找上门来英文
6

我把 22 号端口开放在公网上长达 54 天,看看都有哪些“访客”找上门来

技术博客
SSH蜜罐僵尸网络+3
作者: Arman Hossain
发表时间

作者将伪装成 Ubuntu SSH 服务器的蜜罐开放 54 天,记录到 26.9 万次连接、7556 个攻击 IP、25.5 万次登录尝试;多数为自动化脚本,先用弱口令和默认凭据爆破,再执行 uname 等指纹探测,少数进入交互 shell 并部署 Mirai、反连载荷或尝试清痕。流量主要来自云 VPS 与被控家宽设备,Solana 节点成为明确目标,结论是公网 22 端口会在数秒内被持续扫描,SSH 必须禁用密码登录并使用密钥认证。

智能体 Harness 工程英文
40

智能体 Harness 工程

技术博客
AI代理架构Harness工程+3
作者: Addy Osmani
发表时间

编码智能体的核心在于"Harness工程"——即围绕AI模型构建的脚手架系统,包括提示词、工具、沙箱、反馈循环等组件,其重要性甚至超过模型本身,优质Harness配合普通模型可胜过劣质Harness配合顶级模型;该工程遵循"棘轮"原则,将每次失败转化为永久规则,通过AGENTS.md、钩子、沙箱隔离、上下文压缩、Ralph循环等机制实现持续优化,且随着模型能力提升,Harness的复杂度会向更高层级迁移而非消失,最终趋向动态组装、多智能体协作的编译器形态。

智能体技术栈博弈英文
11

智能体技术栈博弈

技术博客
企业智能体持久执行+3
作者: Addy Osmani
发表时间

作者认为当前生产级智能体的主要瓶颈不在模型,而在底层架构失衡,导致治理、可靠性和审计风险持续累积;未来一年团队应押注四件事:为智能体建立平台级身份与权限控制,提供跨系统通用上下文,支持跨天跨周的持久执行与人工审批,以及用开放平台替代自建管道;谁先把智能体基础设施标准化,谁就能把资源集中到真正有差异化的业务逻辑上。

记忆可能正在损害你的AI产品英文
11

记忆可能正在损害你的AI产品

技术博客
AI记忆上下文膨胀+3
作者: Manthan Gupta
发表时间

AI产品把记忆当默认卖点,但作者认为它本质是高成本的产品与系统税:常导致答案被旧偏好锚定、上下文膨胀、调试更难,并放大隐私泄露与安全投毒风险。多数场景应先做显式配置、工作流状态和任务级检索,只有长期连续型产品才值得谨慎引入记忆。

我如何用每月20美元的技术栈运营多个月10万美元收入的初创公司英文
16

我如何用每月20美元的技术栈运营多个月10万美元收入的初创公司

技术博客
Go后端SQLite+3
作者: Steve Hanov
发表时间

作者虽有营收和用户仍因过度精简难获融资,因此给出低成本创业方案:用5到10美元VPS、Go、SQLite、本地GPU跑批量AI,必要时用OpenRouter接入顶级模型,用Copilot控开发成本;多数初创公司无需复杂云架构和风投,也能以极低烧钱实现可扩展增长。

每页显示 77
上一页 1 / 8 下一页