文章列表 - 第 3 页

创建时间：

全部

排序：

发表时间倒序

排序：发表时间倒序

中文

面向长周期任务的适配智能学习体上下文管理

学习资料

AdaCoMGRPO+3

作者: Lu Yi等

发表时间：2026/6/4

AdaCoM用外部小型LLM为冻结Agent学习上下文删改、合并与压缩策略，缓解长任务中的上下文退化，无需训练闭源Agent；实验显示网页搜索平均相对提升39.0%，深度研究中Kimi、DeepSeek分别提升9.0%和22.3%，核心结论是强Agent适合保留较长高保真上下文，弱Agent需激进压缩，且策略可在能力相近Agent间迁移复用。

英文

重新思考搜索：代码生成

技术博客

代码搜索搜索架构+3

作者: Perplexity

发表时间：2026/6/1

Perplexity推出Search as Code架构，将搜索栈拆成可由模型生成代码调用的SDK原语，并在安全沙箱中完成检索、排序、过滤、并行和聚合，使智能体能为复杂任务动态构建搜索流程；评测显示SaC在五项基准中四项领先，WANDR领先次优系统2.5倍，同时降低成本和上下文噪声，推动搜索从固定接口转向可编程智能体基础设施。

中文

从零训练大语言模型

学习资料

LLM训练PyTorch+3

作者: FareedKhan

发表时间：2026/5/31

教程用PyTorch从零复现Transformer语言模型，覆盖The Pile数据下载、预处理、训练、生成与代码解析，支持1300万至20亿参数规模；项目模块化实现MLP、自注意力、因果掩码、Transformer块、嵌入和位置编码，并给出GPU显存与可训练规模参考。

中文

假如…… 我们正身处人工智能泡沫之中

佳文共赏

AI泡沫数据中心+3

作者: Ed Zitron

发表时间：2026/5/31

Ed Zitron认为AI行业已陷入由OpenAI、Anthropic、NVIDIA、云巨头和风投共同维持的泡沫，核心矛盾是算力承诺、GPU销售、数据中心建设和真实收入之间数学上无法闭合；需求主要由少数AI公司和云厂商互相投喂制造，企业ROI不清、用户增长和利润率恶化，一旦数据中心融资放缓或OpenAI、Anthropic增速不达预期，将引发GPU减值、债务违约、云厂商收入缺口、供应链崩溃和风投清算，结论是AI泡沫不是是否破裂，而是何时以何种方式爆炸。

中文

Aether：可演进的视觉素材库插件

开源项目

Aether提示词精修+3

作者: shawnxie94

发表时间：2026/5/29

Aether 是用于稳定复用视觉风格的 Codex 插件，可把参考图、提示词想法和生成结果沉淀为视觉记忆，后续自动召回风格、光影、色彩、构图、氛围、角色和负面规则来精修提示词，并根据新素材决定新建、归类、变体或合并，形成可演进素材库；它还记录生成结果、一致性检查和反馈，帮助持续复用有效经验、减少偏差，适合长期保持图片创作风格一致。

中文

语言模型需要“睡眠”吗？借助离线循环机制优化在线推理

学习资料

LLM睡眠注意力缓存+3

作者: Sangyun Lee等

发表时间：2026/5/28

LLM Sleep提出在上下文窗口满后暂停输入，执行多次离线递归前向传播，用学习规则更新SSM快速权重，再清空KV缓存继续预测；其核心判断是长上下文失败主要源于被驱逐信息缺乏足够计算转化，而非内存容量不足。实验显示睡眠循环越多，Rule 110、Depo多跳检索、GSM-Infinite和滑动窗口任务的深度推理表现越好，收益集中在难例；代价是训练成本随循环深度线性上升且更不稳定。

中文

Codex 自我蒸馏提示词

佳文共赏

Codex子代理+3

作者: Vaibhav (VB) Srivastav

发表时间：2026/5/28

使用 Codex 回溯近30天会话、记忆与纪事，识别重复、高成本、可复用的工作流程，优先复用现有技能、子代理或自动化，只为高置信度缺口创建最小资产，并输出候选短名单、创建结果、跳过项及需更多证据的事项，避免推测、重叠和宽泛封装。能有效沉淀有用技能、子代理或自动化。

英文

选择保持人性

佳文共赏

AI写作AI助教+3

作者: Ethan Mollick

发表时间：2026/5/27

AI写作和学习工具正在制造低信息密度内容，并诱发“认知投降”：用户把思考、写作、判断交给AI。研究显示，直接给答案会削弱学习和判断，定制化引导则能提升成绩。关键不在是否使用AI，而在有意识地区分哪些任务可外包、哪些能力必须保留。

英文

通过人工智能扩展人类智能

佳文共赏

AI安全具身认知+3

作者: Microsoft

发表时间：2026/5/27

现代AI并非复制人类智能，也不是简单统计工具，而是学习并延展沉淀在人类语言中的认知结构，因此能生成流畅文本、代码和推理，却因缺乏与现实世界的直接经验而容易幻觉、组合推理失败、视觉理解脆弱。AI风险不在于其拥有自主意图，而在于无责任地放大未扎根现实的模式，可信AI必须依赖人类设计的治理、评估、审计和安全约束。

中文

DeepSeek-Reasonix：专为DeepSeek优化的AI编码智能体框架

开源项目

MCP服务QQ频道+3

作者: esengine

发表时间：2026/5/27

DeepSeek-Reasonix是面向DeepSeek优化的开源终端AI编码智能体框架，以前缀缓存稳定性为核心，通过缓存优先循环、工具调用修复和成本控制降低长会话token开销，支持CLI、桌面端、QQ频道、MCP、技能与记忆系统。

每页显示

条，共 464 条

全部文章

面向长周期任务的适配智能学习体上下文管理

重新思考搜索：代码生成

从零训练大语言模型

假如…… 我们正身处人工智能泡沫之中

Aether：可演进的视觉素材库插件

语言模型需要“睡眠”吗？借助离线循环机制优化在线推理

Codex 自我蒸馏提示词

选择保持人性

通过人工智能扩展人类智能

DeepSeek-Reasonix：专为DeepSeek优化的AI编码智能体框架