全部文章

浏览最新公开文章、摘要与延伸阅读。肖恩子的知识花园

排序:发表时间倒序
智能体评估准备清单英文
19

智能体评估准备清单

学习资料
CI/CDLangSmith+3
作者: LangChain
发表时间

文章给出智能体评测落地清单:先人工审查真实轨迹并明确单任务成功标准,优先从最有信号的全流程评测起步,再按任务构建可验证数据集、为不同维度设计合适评审器,结合离线、在线和人工复查持续迭代,并将高通过率能力评测接入CI/CD形成回归测试,最终用生产反馈闭环提升可靠性。

我们如何使用抽象语法树(AST)将 Workflows 代码转换为可视化图表英文
8

我们如何使用抽象语法树(AST)将 Workflows 代码转换为可视化图表

技术博客
AST解析Cloudflare+3
作者: CloudFlare
发表时间

Cloudflare为所有已部署Workflows提供可视化流程图,核心做法是在部署时抓取打包压缩后的代码,用Rust Worker结合AST静态解析步骤、函数、分支、循环及Promise/await关系,重建执行图并标注并行与顺序,这解决了“工作流即代码”难以直接可视化的问题,提升了调试、理解和后续实时追踪能力。

用于数据分析的编码智能体英文
15

用于数据分析的编码智能体

学习资料
数据可视数据新闻+3
作者: Simon Willison
发表时间

Simon Willison将在NICAR 2026开设三小时工作坊,介绍如何把Claude Code、OpenAI Codex等编码代理用于数据新闻,重点涵盖数据提问、探索、清洗、可视化与网页抓取,目标是让参与者掌握将这类工具应用于简单到复杂报道项目的方法,并获得一套更高效的数据采集、分析与呈现能力。

Apifox 供应链投毒攻击 — 完整技术分析中文
10

Apifox 供应链投毒攻击 — 完整技术分析

技术博客
Apifox投毒Electron+3
作者: 白帽酱
发表时间

Apifox桌面端在2026年3月4日至22日期间遭遇CDN供应链投毒,恶意JS借Electron权限在Windows、macOS、Linux上窃取Apifox令牌、SSH密钥、Git凭证、命令历史、K8s配置等,并通过C2持续下发代码实现远程控制和横向攻击,虽入口文件已恢复,但期间启动过客户端的用户应按主机已失陷处理并立即轮换全部相关凭证。

在中国人工智能生态圈内深耕两周后的感悟英文
15

在中国人工智能生态圈内深耕两周后的感悟

佳文共赏
中国AI具身机器人+3
作者: José Maria Macedo
发表时间

作者考察中国AI生态后判断,硬件显著强于软件:深圳与大湾区供应链带来极快迭代和全球竞争力;软件层面模型、营收与爆款公司均落后西方,且估值已明显泡沫化。同时,中国创业者执行强但原创性偏弱,本地VC又偏好名校大厂履历,可能错过真正具全球潜力的少数异类创始人。

关于他妈的慢下来的一些想法英文
12

关于他妈的慢下来的一些想法

佳文共赏
人机协作代码质量+3
作者: Mario Zechner
发表时间

作者认为编码代理在生产环境被过度放权,正加速制造脆弱、复杂且难维护的软件:代理会重复犯错、缺乏全局理解与有效检索,导致代码膨胀、测试失真、质量下滑,最终把团队和代码库逼入死角;现阶段应把代理限定在可局部验证、低风险的辅助任务中,由人主导架构、评审与最终质量关,放慢速度换取可维护性与控制权。

你每天喝的咖啡或许正在保护你的大脑,一项历时 43 年的研究发现英文
3

你每天喝的咖啡或许正在保护你的大脑,一项历时 43 年的研究发现

佳文共赏
咖啡因痴呆预防+3
作者: Mass General Brigham
发表时间

一项跟踪13万余人长达43年的研究发现,适量饮用含咖啡因咖啡或茶与更低痴呆风险和更慢认知衰退相关,其中每天2至3杯咖啡或1至2杯茶效果最明显,痴呆风险约降18%,脱咖啡因咖啡无同等关联,且这一关联在高遗传风险人群中也成立。

编程的本质是思维,不是语言中文
16

编程的本质是思维,不是语言

佳文共赏
AI编程C语言+3
作者: manateelazycat
发表时间

文章将AI编程类比为从汇编到C语言的抽象升级,指出新范式初期总因可控性、性能和审查问题遭质疑,但长期看会成为更高效的人机表达方式,真正决定编程能力的不是是否手写代码或掌握某种语言,而是拆解问题、定义边界、发现错误和构建系统的编程思维。

面向长期运行应用开发的 harness 设计英文
13

面向长期运行应用开发的 harness 设计

技术博客
Playwright代码代理+3
作者: Anthropic
发表时间

Anthropic通过为Claude引入规划、生成、评估多智能体架构,并用可评分标准、QA反馈和长时任务编排替代单智能体自评,显著提升了前端设计质量与端到端应用构建能力;结果是模型能在数小时内自主完成更完整、可用的全栈产品,但代价是更高的成本、时延与系统复杂度,且评估环节仍需随模型能力迭代简化。

AI 编码助手并未加快交付,因为编码从来都不是瓶颈英文
18

AI 编码助手并未加快交付,因为编码从来都不是瓶颈

佳文共赏
AI编程代码评审+3
作者: Eran Stiller
发表时间

AI编程助手提升了个人写码产出,却未显著加快项目交付,因为瓶颈已从编码转向需求定义、架构对齐与结果验证;行业数据也显示任务和PR增加同时评审时间大幅上升;结论是团队应把高质量规格与可验证验收标准作为核心产物,采用“灰盒”方式由人主导意图与验收,代码实现更多交给AI。

每页显示 351
上一页 19 / 36 下一页