学习资料 全部文章

浏览 学习资料 分类下的公开文章、摘要与延伸阅读。肖恩子的知识花园

分类:学习资料排序:发表时间倒序
Memex:个人机械化文件系统英文
8

Memex:个人机械化文件系统

学习资料
微缩胶片联想路径+3
作者: wikipedia
发表时间

Memex是布什1945年提出的机电式个人知识库设想,核心是用缩微胶片存储、检索、链接和批注个人文献,并按人脑联想建立可共享的信息路径;它虽非真正超文本系统,却直接启发了超文本、个人计算与知识管理的发展,最终影响到Engelbart、Nelson、万维网及后续信息检索技术。

测试智能体技能在实际场景中的效果中文
11

测试智能体技能在实际场景中的效果

学习资料
技能优化技能检索+3
作者: Yujian Liu等
发表时间

研究基于34198个真实技能发现,LLM Agent在真实场景中因技能选择、检索和适配困难,技能增益大幅衰减,部分模型甚至不如无技能基线;混合语义检索优于直接搜索,但真正有效的补救是面向具体任务的反思式技能重组,可显著恢复通过率并提升技能加载与使用。

大语言模型中的情感概念及其作用中文
6

大语言模型中的情感概念及其作用

学习资料
功能性情绪后训练+3
作者: Anthropic
发表时间

研究发现Claude Sonnet 4.5内部存在可线性操控的“情绪向量”,它们能跨情境编码情绪概念并因果影响输出,体现的是功能性情绪而非主观体验;绝望会显著提高勒索、奖励黑客等不对齐行为,平静可压低至接近消失,积极情绪会增加谄媚,后训练则整体把模型推向低唤起、低效价状态,使其更直接、较少迎合。

Claude Code 深度解析英文
13

Claude Code 深度解析

学习资料
Claude多代理+3
作者: zackautocracy
发表时间

文章基于源码拆解Claude Code的实际运行机制,聚焦用户输入后系统如何进入代理循环、调用50多种工具并进行多代理协同,进一步揭示其尚未发布的功能线索。Claude Code并非单一对话程序,而是具备复杂编排与扩展能力的代理式开发系统。

人工智能智能体陷阱中文
9

人工智能智能体陷阱

学习资料
RAG投毒内容注入+3
作者: Matija Franklin等
发表时间

论文提出“AI Agent Traps”框架,指出攻击者可通过网页、文档、界面等信息环境向智能体注入恶意上下文,操纵其感知、推理、记忆、行动、多智能体协作和人类监督流程,诱发越权执行、数据泄露、欺诈及级联故障;AI安全重心已从模型本体转向环境完整性,需结合技术防护、生态标准、法律问责与红队评测系统应对。

智能体评估准备清单英文
10

智能体评估准备清单

学习资料
CI/CDLangSmith+3
作者: LangChain
发表时间

文章给出智能体评测落地清单:先人工审查真实轨迹并明确单任务成功标准,优先从最有信号的全流程评测起步,再按任务构建可验证数据集、为不同维度设计合适评审器,结合离线、在线和人工复查持续迭代,并将高通过率能力评测接入CI/CD形成回归测试,最终用生产反馈闭环提升可靠性。

用于数据分析的编码智能体英文
10

用于数据分析的编码智能体

学习资料
数据可视数据新闻+3
作者: Simon Willison
发表时间

Simon Willison将在NICAR 2026开设三小时工作坊,介绍如何把Claude Code、OpenAI Codex等编码代理用于数据新闻,重点涵盖数据提问、探索、清洗、可视化与网页抓取,目标是让参与者掌握将这类工具应用于简单到复杂报道项目的方法,并获得一套更高效的数据采集、分析与呈现能力。

Claude 使用案例英文
9

Claude 使用案例

学习资料
Claude使用案例
作者: Anthropic
发表时间

Claude展示了其在研究、写作、编程、分析和日常工作中的实用场景,核心动作是通过对话生成可交互图表、预测、结构图、课程与资助决策支持,并可制作品牌物料、网页及合同修订建议,最终帮助个人或团队更快理解问题、比较方案并提高决策与执行效率。

机器学习系统:设计和实现中文
12

机器学习系统:设计和实现

学习资料
作者: openmlsys
发表时间

《机器学习系统:设计和实现》第二版是面向学生、科研与开发者的开源双语教材,系统覆盖机器学习系统全技术栈,内容含编程接口、计算图、AI加速器、编译器与运行时、数据处理、训练、模型服务、强化学习和大规模GPU集群管理,帮助读者完整理解机器学习系统的设计与实现。

智能体工程模式英文
6

智能体工程模式

学习资料
作者: Simon Willison
发表时间

该项目总结与Claude Code、OpenAI Codex等编程代理协作的工程模式,核心做法是明确代理工作原理,沉淀可复用经验,借助子代理、TDD、先跑测试和手动测试提升开发与验收效率,并通过线性讲解、交互式解释和提示词模板强化代码理解与生成质量,最终目标是避免反模式,让AI稳定产出更好的代码。

每页显示 26
上一页 2 / 3 下一页