全部文章

浏览最新公开文章、摘要与延伸阅读。肖恩子的知识花园

排序:发表时间倒序
Google NotebookLM 推出“电影级视频概览”新功能中文
1

Google NotebookLM 推出“电影级视频概览”新功能

业界资讯
作者: AIBase
发表时间

谷歌NotebookLM上线“电影级视频概览”,用户导入研究资料或笔记即可由Gemini3、Nano Banana Pro、Veo3等模型自动生成沉浸式定制讲解视频,现仅向18岁以上Google AI Ultra订阅用户开放且仅支持英语,推动产品从研究辅助向创意生产力工具升级。

联想新款 T 系列 ThinkPad 笔记本电脑在可维修性方面获得 10/10 的评分英文
3

联想新款 T 系列 ThinkPad 笔记本电脑在可维修性方面获得 10/10 的评分

业界资讯
作者: Jeff Suovanen
发表时间

联想ThinkPad T14 Gen7与T16 Gen5在iFixit可修复性评测获暂定10/10,因与iFixit提前介入开发并提升电池、键盘、散热、雷电口等模块化与标准件可更换性,待官方零件与维修文档上线后将最终确认,结果把高可维修从小众特性推向主流商用笔记本基线并降低维护成本与废弃物。

评估和测试智能体技能实用指南英文

评估和测试智能体技能实用指南

技术博客
作者: Philipp Schmid
发表时间

AI代理技能数量激增但多数未做评测且常由AI生成,文中给出落地评测方法:先量化成功标准,再用10–20条提示集驱动代理运行并以正则等确定性检查或LLM裁判评分持续迭代,案例通过改写触发描述与将警告改为明确指令把Gemini技能通过率从66.7%提升到100%,结论是用评测防止回退并据结果决定技能维护或退役。

LangChain Skills英文
4

LangChain Skills

开源项目
作者: LangChain
发表时间

LangChain团队开源langchain-skills仓库11项技能,按需动态加载脚本与指令,覆盖LangChain、LangGraph、DeepAgents,使Claude Code相关任务通过率由25%升至95%,可用npx skills安装并绑定代理,后续将持续扩充并同步发布LangSmith技能。

软件工程循环中的人类与智能体英文
3

软件工程循环中的人类与智能体

佳文共赏
作者: Kief Morris
发表时间

主张人类不应放任代理完成开发也不必逐行审查代码,而应“在环上”设计并管理从需求到交付的多层反馈回路,通过规格、测试、评估与流程指导构建并持续改进代理执行的“harness”,再引入测试指标、性能与故障验证、生产与业务数据驱动代理自我评估与提出改进,形成持续加速的飞轮,以降低时间成本与失控风险并提升系统可靠性与可演进性。

2026年中国AI发展趋势前瞻中文
5

2026年中国AI发展趋势前瞻

佳文共赏
作者: 清华大学
发表时间

2025中国AI企业超6000家、核心产业规模预计破1.2万亿元,国产开源大模型累计下载超100亿次、AI专利占全球60%;企业集中上市,竞争由“聊天”转向可执行任务的智能体,算力网协同与高质量行业数据加速供给,带动制造与社会治理深度落地,同时以法规与安全认证趋严强化风险管控。

没人会因为简单而获得晋升英文
5

没人会因为简单而获得晋升

佳文共赏
作者: terriblesoftware
发表时间

工程团队在面试、评审和晋升中常奖励“复杂度叙事”,促使工程师过度设计,简单可用的实现因难被描述而被低估;作者建议个人记录取舍与避免的复杂度、评审时为复杂方案设证据门槛,领导调整评价与公开表彰以让“选择简单”可见,否则组织将持续产出不必要的复杂系统。

从被动应对到主动出击:借助大语言模型弥合钓鱼攻击防御缺口英文
4

从被动应对到主动出击:借助大语言模型弥合钓鱼攻击防御缺口

技术博客
作者: Cloudflare
发表时间

Cloudflare将LLM接入邮件安全,实时细分海量恶意邮件并锁定“销售外联”式钓鱼,基于语义意图训练专用模型输出风险分数并与信誉等信号联动拦截且持续自我迭代,使防御从依赖用户事后上报转为提前发现盲区,Q4 2025相关漏报日均提交由965降至769并在2026年初继续大幅下降。

改进 skill-creator:测试、衡量并优化 Agent 技能英文
3

改进 skill-creator:测试、衡量并优化 Agent 技能

业界资讯
作者: Anthropic
发表时间

Anthropic升级skill-creator,支持无代码编写eval与基准测试,多代理并行与对比代理做A/B评估,并优化技能描述以减少误触发与漏触发,帮助作者在模型迭代中监测回归、判断技能是否仍必要并稳定提升效果,现已在Claude.ai、Cowork与插件/仓库上线。

每页显示 385
上一页 26 / 39 下一页