最新回顾
肖恩技术周刊肖恩技术周刊94:决策疲劳
本周读到"编码智能体正让每个人都陷入决策疲劳"这篇文章,深感认同。编码智能体正在制造一种新的认知悖论:代码生成变得越来越容易,但该生成什么却越来越难决定。
肖恩技术周刊肖恩技术周刊93:AI原生研发流程
年初尝到了AI编程的魔力后也高强度使用小半年了,期间诞生了Lumina和Infinitum这俩工具。但过程中总觉得还是缺点什么,需要人工干预的部分仍然很多,整个流程没有达到理想中的流畅。虽然也学习了 Harness Engineering 概念,也看了不少实践案例,但总觉得还是很模糊,很难工程化落地。本周,想着从软件工程本身出发,将其中以人和工具为主的流程改造成以AI和工具为主人为辅,并在和AI的沟通中得到了这个词—— AI 原生研发流程。
肖恩技术周刊肖恩技术周刊92:套壳智能体
一种快速搭建垂直领域智能体的方案,在通用智能体的基础上,通过外层包装和定制化技能层,将其能力快速落地到特定垂直场景的智能体产品。底层通用智能体提供强大的理解、推理和生成能力,相当于智能体的“大脑”;外层壳负责把这些能力组织、封装成可用的产品功能,包括用户交互、任务调度和数据管理;而技能层则聚焦于行业知识、业务规则和工具调用,使智能体能够执行专业任务并产生可靠输出。
最新内容
中文Aether:可演进的视觉素材库插件
Aether 是用于稳定复用视觉风格的 Codex 插件,可把参考图、提示词想法和生成结果沉淀为视觉记忆,后续自动召回风格、光影、色彩、构图、氛围、角色和负面规则来精修提示词,并根据新素材决定新建、归类、变体或合并,形成可演进素材库;它还记录生成结果、一致性检查和反馈,帮助持续复用有效经验、减少偏差,适合长期保持图片创作风格一致。
中文语言模型需要“睡眠”吗?借助离线循环机制优化在线推理
LLM Sleep提出在上下文窗口满后暂停输入,执行多次离线递归前向传播,用学习规则更新SSM快速权重,再清空KV缓存继续预测;其核心判断是长上下文失败主要源于被驱逐信息缺乏足够计算转化,而非内存容量不足。实验显示睡眠循环越多,Rule 110、Depo多跳检索、GSM-Infinite和滑动窗口任务的深度推理表现越好,收益集中在难例;代价是训练成本随循环深度线性上升且更不稳定。
中文Codex 自我蒸馏提示词
任务要求 Codex 回溯近30天会话、记忆与纪事,识别重复、高成本、可复用的工作流程,优先复用现有技能、子代理或自动化,只为高置信度缺口创建最小资产,并输出候选短名单、创建结果、跳过项及需更多证据的事项,避免推测、重叠和宽泛封装。
英文选择保持人性
AI写作和学习工具正在制造低信息密度内容,并诱发“认知投降”:用户把思考、写作、判断交给AI。研究显示,直接给答案会削弱学习和判断,定制化引导则能提升成绩。关键不在是否使用AI,而在有意识地区分哪些任务可外包、哪些能力必须保留。
中文DeepSeek-Reasonix:专为DeepSeek优化的AI编码智能体框架
DeepSeek-Reasonix是面向DeepSeek优化的开源终端AI编码智能体框架,以前缀缓存稳定性为核心,通过缓存优先循环、工具调用修复和成本控制降低长会话token开销,支持CLI、桌面端、QQ频道、MCP、技能与记忆系统。
英文你今天消耗了多少个词元
企业为证明AI工具投资价值,开始用AI生成代码行数、token消耗等指标衡量开发者生产力,但这些数字可被误触或刻意刷高,且与问题是否被正确解决无关;真正高效的工程往往是删减、简化和提升可靠性,按输出体量考核只会奖励无效活动,最终衡量的是订阅消耗而非生产力。