全部文章

浏览最新公开文章、摘要与延伸阅读。肖恩子的知识花园

排序:发表时间倒序
编码代理如何重塑工程、产品和设计领域英文
17

编码代理如何重塑工程、产品和设计领域

佳文共赏
作者: LangChain
发表时间

编码代理让写代码成本骤降,EPD流程从“先写PRD再出设计再实现”转为“先快速原型再集中评审”,瓶颈由实现转到架构、产品与交互的审查与仲裁;传统PRD式瀑布死亡但需求意图文档仍必需且可演化为结构化提示;角色更趋融合,通才与产品感更关键,专才门槛提高,组织分化为用代理构建的builder与高强度系统思考的reviewer,坏产品想法将放大浪费与产品膨胀风险。

智能体框架的深层剖析英文
16

智能体框架的深层剖析

技术博客
作者: LangChain
发表时间

Agent由模型与Harness组成,Harness指除模型外的代码与执行机制,通过提供持久状态、文件系统与Git、工具与代码执行、沙箱环境、搜索与记忆注入、上下文压缩与输出卸载、规划与自验证循环及编排钩子,把仅能输入输出文本的模型变成可长期自主完成任务的工作引擎,并与模型后训练共同演化但也可能导致对特定工具逻辑过拟合,因此优化Harness本身可显著改变同一模型的效果。

不要让AI为你代笔英文
142

不要让AI为你代笔

佳文共赏
LLM写作写作思维+3
作者: Alex Woods
发表时间

写作的核心是通过提出并回答问题来澄清目标、加深理解并建立能力与信任,用LLM直接代写会失去独立思考训练,也会削弱作者可信度,让人怀疑观点是否真实;LLM更适合用于调研、校对、记录和发散想法,若要真正提升效率,必须同步提高人的思考质量。

2026,写给 AI 创业者的慷慨、残酷、与迷雾中文
17

2026,写给 AI 创业者的慷慨、残酷、与迷雾

佳文共赏
作者: Jiayuan
发表时间

AI代理让写代码从辅助转为主导并快速商品化,个人产出与企业组织随之加速重构且裁员叙事被市场买单,历史类比印刷术、电力与云计算表明能力一旦变廉价价值会迁移并出现供给爆炸与注意力稀缺,创业竞争转向问题定义、产品判断、用户与数据等代码之外护城河,机会在围绕新能力重写软件形态并把握解构后再整合的窗口。

我的编码智能体工作效率提高技巧英文
9

我的编码智能体工作效率提高技巧

佳文共赏
作者: Simon Willison
发表时间

作者主张囤积可运行的技术解法与代码样例,通过博客与仓库并借助LLM持续扩充,再让编码代理检索并重组既有示例快速生成新工具,如合并PDF.js与Tesseract.js做浏览器OCR,结论是技巧只需攻克一次即可反复复用并显著加速后续开发。

GPT-5.4 思维系统卡片英文
9

GPT-5.4 思维系统卡片

学习资料
作者: OpenAI
发表时间

GPT-5.4 Thinking是GPT-5系列最新推理模型,沿用该系列既有安全缓解框架,但首次在通用模型中针对“网络安全高能力”部署专门缓解措施,网络安全方案继承GPT-5.3 Codex在ChatGPT与API的做法,文中亦称其为gpt-5.4-thinking,且基线对比对象为GPT-5.2 Thinking。

为什么我不进行氛围编程英文
42

为什么我不进行氛围编程

佳文共赏
LLM编码数据误读+3
作者: jacobharr
发表时间

作者拒绝将LLM作为主要编程方式,认为它虽能处理简单任务、降低编码层面的偶然复杂度,却无法解决系统设计、数据理解、架构取舍等本质复杂度;消除摩擦会削弱学习、判断、协作与责任感,并把风险转嫁给使用者,最终可能提高产出速度,却未必带来更可靠、更有伦理的软件。

评估 Skills英文
10

评估 Skills

技术博客
作者: LangChain
发表时间

LangChain为Codex、Claude Code等编码代理构建按需加载的技能,并提出评测管线:在一致沙箱中设定可度量任务,对比无技能与不同拆分技能的表现,用LangSmith全程追踪行动与失败原因并迭代,结果任务完成率由9%升至82%,结论是技能必须依赖系统化评测与可观测性才能稳定增益。

评估和测试智能体技能实用指南英文
9

评估和测试智能体技能实用指南

技术博客
作者: Philipp Schmid
发表时间

AI代理技能数量激增但多数未做评测且常由AI生成,文中给出落地评测方法:先量化成功标准,再用10–20条提示集驱动代理运行并以正则等确定性检查或LLM裁判评分持续迭代,案例通过改写触发描述与将警告改为明确指令把Gemini技能通过率从66.7%提升到100%,结论是用评测防止回退并据结果决定技能维护或退役。

LangChain Skills英文
21

LangChain Skills

开源项目
作者: LangChain
发表时间

LangChain团队开源langchain-skills仓库11项技能,按需动态加载脚本与指令,覆盖LangChain、LangGraph、DeepAgents,使Claude Code相关任务通过率由25%升至95%,可用npx skills安装并绑定代理,后续将持续扩充并同步发布LangSmith技能。

每页显示 351
上一页 25 / 36 下一页