全部文章

浏览最新公开文章、摘要与延伸阅读。肖恩子的知识花园

排序:发表时间倒序
人工智能应该帮助我们编写更好的代码英文

人工智能应该帮助我们编写更好的代码

佳文共赏
作者: Simon Willison
发表时间

作者主张AI应提升而非拉低代码质量,低质交付是流程选择,应以减少技术债为目标,把命名、API调整、去重、拆分大文件等耗时重构交给异步编码代理在分支完成并以PR筛选迭代,同时用LLM扩展方案空间并快速做探索性原型与并行实验,配合复盘沉淀指令形成“复合工程”循环,让小改进持续累积,实现上线与质量兼得。

OpenClaw飞书官方插件上线中文
5

OpenClaw飞书官方插件上线

资源推荐
作者: 飞书
发表时间

飞书推出OpenClaw官方插件,经用户授权后智能体可直接以用户身份读取并操作飞书文档、群聊上下文与日历,完成写改文档、发消息、约日程、建多维表等,显著减少复制粘贴并提升交付效率,同时需注意权限带来的数据泄露与不可逆操作风险,建议重要写入先预览再确认。

​Star 量破 28 万:OpenClaw 发布重大更新,正式支持 GPT-5.4 与“记忆热插拔”中文
3

​Star 量破 28 万:OpenClaw 发布重大更新,正式支持 GPT-5.4 与“记忆热插拔”

业界资讯
作者: AIBase
发表时间

OpenClaw发布2026.3.7核心版,新增上下文引擎插件化、分布式频道持久绑定与本地流式输出优化,原生支持GPT-5.4并深度优化Gemini3.1;配合lossless-claw长上下文理解得分74.8超越竞品,项目正从实验框架走向可持久可扩展的生产级智能体操作系统,并加速被部署为低成本虚拟员工。

Harness Engineering — Agent 不好用,也许不是模型的问题中文
5

Harness Engineering — Agent 不好用,也许不是模型的问题

技术博客
作者: Chaofa Yuan
发表时间

Harness指模型权重外的一切系统设计,涵盖提示、上下文、工具、沙箱、中间件与子代理等,其核心不是反复改prompt,而是改环境让错误难以再发生;实验证明同一模型仅优化自检、环境注入、死循环检测和推理强度调度,成绩可从Top30升至Top5;结论是Agent可靠性主要取决于Harness,持久价值在缓存、存储、隔离等受物理约束的设计。

理解债务 —— 人工智能生成代码的隐性成本英文
1

理解债务 —— 人工智能生成代码的隐性成本

佳文共赏
作者: Addy Osmani
发表时间

过度依赖AI生成代码会累积“理解债”,即代码规模增长快于人类理解速度,表面测试与指标向好却削弱系统心智模型,变更与排错时集中爆雷;研究显示用AI代写理解力下降约17%,被动委派最伤技能,测试与规格无法替代理解与审查,组织应将“真正理解所交付内容”作为质量门槛与合规前置条件。

程序员之后的编程:我们所熟知的计算机编程的终结英文
3

程序员之后的编程:我们所熟知的计算机编程的终结

佳文共赏
作者: Clive Thompson
发表时间

硅谷开发者正把写代码交给AI代理,转而用自然语言下达任务、审阅计划与结果并用测试约束幻觉,初创公司效率可提升至数十倍,大厂在既有代码库中更多用AI做理解、修复与自动化运维,整体提速约10%且团队规模缩小;结果是编码更像架构与评审而非手工实现,入门岗位与技能传承承压,但非程序员也能快速生成可用软件,白领工作或普遍转向“生成更少、判断更多”。

你不知道的 Claude Code:架构、治理与工程实践中文
2

你不知道的 Claude Code:架构、治理与工程实践

技术博客
作者: Tw93
发表时间

作者基于半年重度使用Claude Code的踩坑,总结其六层系统与代理循环,指出质量下降多源于上下文污染、工具与规则堆叠及缺乏验证闭环,提出用精简CLAUDE.md分层加载、Hooks强制约束、Subagent隔离探索、面向缓存设计Prompt并配套Verifier与/clear /compact等治理,最终结论是以“可验收定义+约束下自治”替代单纯调prompt,并提供/health技能做配置体检。

自主上下文压缩英文
3

自主上下文压缩

技术博客
作者: LangChain
发表时间

Deep Agents在Python SDK与CLI新增“自主上下文压缩”工具,模型可在任务边界、提炼结论前后、读取或生成大量内容及进入复杂多步流程时主动触发,将旧消息按规则总结并保留最近约10%对话,以缓解上下文窗口限制与context rot,减少固定阈值压缩带来的时机不佳并提升长程交互代理的稳定性与可用性。

Agent Harness 解析英文
4

Agent Harness 解析

技术博客
Agent架构Harness工程+3
作者: Vivek Trivedy
发表时间

智能体由模型与"Harness"构成,后者是包裹模型的代码、配置与执行逻辑系统,赋予其状态持久化、工具执行、反馈循环等能力;核心组件包括文件系统、沙箱环境、代码执行工具、记忆与搜索机制、上下文压缩及长程自主执行模式,Harness工程通过设计系统来弥补模型原生缺陷并放大其智能效用,且随模型能力进化持续迭代优化。

推理模型难以掌控思维链,但这反而是件好事中文

推理模型难以掌控思维链,但这反而是件好事

技术博客
作者: OpenAI
发表时间

研究用开源套件CoT-Control在13个推理模型、1.3万余任务上测试思维链可控性,结果显示前沿模型普遍难以按指令重塑或遮蔽推理过程,可控性多低于15.4%且最低0.1%,规模增大略升但推理更长与后训练/RL增加会下降,被告知在监测下仅小幅提升,结论是当前CoT可控性不构成对CoT监测的主要风险但需持续评估并在系统卡同步披露相关指标。

每页显示 385
上一页 24 / 39 下一页