肖恩技术周刊93:AI原生研发流程

901
发表时间2026/5/18
本期范围2026-05-11 - 2026-05-16
肖恩技术周刊
发表时间

内容

肖恩技术周刊93:AI原生研发流程

封面图提示词:A horizontal 16:9 cinematic sci-fi mecha poster, showing a sleek humanoid biomechanical robot in side profile, standing on the right side of the frame with clean negative space on the left. The mech has sharp angular armor, vivid yellow-orange main plating, white shoulder and head armor, black internal mechanical joints, a glowing red eye visor, and a tall fin-like structure behind its back. Full body visible, elegant and aggressive silhouette, ultra-detailed hard-surface design, metallic reflections, scratches, subtle cracks, layered panel lines, and dynamic yellow-orange debris and paint splatter around the body. Minimalist light gray background, dramatic volumetric lighting, high-end concept art quality, futuristic, polished, visually striking, no text.

AI 原生研发流程

年初尝到了AI编程的魔力后也高强度使用小半年了,期间诞生了Lumina和Infinitum这俩工具。但过程中总觉得还是缺点什么,需要人工干预的部分仍然很多,整个流程没有达到理想中的流畅。虽然也学习了 Harness Engineering 概念,也看了不少实践案例,但总觉得还是很模糊,很难工程化落地。本周,想着从软件工程本身出发,将其中以人和工具为主的流程改造成以AI和工具为主人为辅,并在和AI的沟通中得到了这个词—— AI 原生研发流程

一种以 AI Agent 作为新的研发执行单元,重新组织需求、设计、开发、测试、部署和复盘的完整流程。需求不再只是静态文档,而会被 AI 转化为可验证的目标、技术方案、任务拆解和执行计划;代码开发也不再只是单点辅助,而是由多个 Agent 在明确上下文、权限、任务边界和质量门禁下协同完成。

核心价值是把软件交付过程变成一个可编排、可审查、可追踪、可复用的智能化系统。需要理解历史代码、项目规范、架构约束和业务上下文,能够把需求拆解成任务 DAG,调度合适的 Agent 执行开发、测试和修复,并通过 CI、自动化测试、代码审查、安全扫描和部署流水线形成工程闭环。

AI 原生研发流程的护城河不在于某个单一模型,而在于围绕模型构建的研发 Harness:上下文供给、任务规划、工具调用、权限控制、验证体系、失败归因和项目记忆。每一次需求交付都会沉淀为新的工程经验,让下一次 Agent 执行更稳定、更符合团队习惯,也让软件研发从“人使用工具”逐渐演进为“人管理目标,Agent Team 执行过程”的新型协作模式。

概念是明白了,但实操起来依旧很难,后续打算先做个小工具,直接以实践方式学习。大家如果有相关经验或工具,欢迎分享。

个人动态

Infinitum发布v0.1.3版本

个人资讯聚合工作台,提供 RSS 抓取、正文补抓、AI 摘要、事件归组、AI 日报等功能,提高信息获取效率。周维度例行更新,修复了一些已知问题。

Lumina发布v1.1.4版本

个人信息管理工作台,通过网页应用 + 浏览器扩展,帮助你完成文章采集、AI 解读和阅读管理。周维度例行更新,修复了一些已知问题。

热点事件

事件一句话说明
Anthropic 推进巨额融资并扩大企业客户Anthropic 正推进规模达 400 亿至 500 亿美元的融资,企业客户数量也被报道已超过 OpenAI。
OpenAI 发布 GPT-5.5-Cyber 并成立企业部署公司OpenAI 推出网络安全专用模型 GPT-5.5-Cyber,并通过 Trusted Access for Cyber 框架限制访问权限。
Anthropic 发布 Claude for Small BusinessAnthropic 推出面向中小企业的 Claude for Small Business 自动化服务套件。
Google 发布 Gemini Intelligence 与 GooglebooksGoogle 在 Android Show 发布 Gemini Intelligence,并推出 AI 原生笔记本 Googlebooks。
阿里巴巴发布通义千问购物智能体阿里巴巴推出基于通义千问的 AI 店小蜜与 AI 购物助手,并全面接入淘宝平台。
OpenAI 考虑起诉苹果OpenAI 被报道考虑对苹果采取法律行动,指控其阻碍 ChatGPT 在 iOS 生态中的集成。
快手拟分拆可灵 AI 融资快手正评估分拆 AI 视频生成业务可灵 AI,计划以 200 亿美元估值融资 20 亿美元。
GitLab 与通用汽车裁员转向 AIGitLab 重组并押注 AI 代理,通用汽车也裁减 IT 员工以推进 AI 自研转型。
OpenAI 升级 Codex 为通用开发代理OpenAI 全面升级 Codex,新增电脑控制、浏览器集成和 PR 审查等开发代理能力。
xAI 发布 Grok Build 编程智能体xAI 推出 Grok Build,强调“先规划后执行”的编程工作流,并支持多平台与自动化集成。

更多资讯可查看Infinitum AI日报:https://infinitum.shawnxie.top/daily

佳文共赏

Forward Deployed Engineer:AI 时代的新宠岗位,到底干什么?

OpenAI、Anthropic、Google正集中押注FDE岗位:OpenAI以40亿美元外部资金成立部署公司并收购150人团队,Anthropic筹建独立企业AI服务公司,Google则压缩面试加速自招。FDE负责进驻客户现场,把AI模型接入真实业务。AI竞争重心正从模型能力转向企业落地,FDE成为商业化关键,但独立公司模式可能使其更接近咨询而非产品反馈枢纽。

裁员将持续进行,直到我们学会使用人工智能

科技公司裁员并非因AI直接替代员工,而是AI让代码等“投入”暴增,却未同步转化为功能、收入等“结果”,还推高token成本并放大组织协同摩擦;裁员短期可抵消AI开支、减少对齐成本,因此在企业学会把AI效率转化为真实业务增长前,相关裁员仍会持续。

技术博客

Claude Code 在大型代码库中的使用:最佳实践与入门指南

Claude Code在大型代码库落地的关键不在模型本身,而在围绕代码库建立可导航、可维护、可治理的配置体系:用分层CLAUDE.md提供上下文,配合hooks、skills、plugins、LSP、MCP和subagents提升检索、执行与分发效率,并由专人或团队持续维护规则和治理;组织若提前建设基础设施、控制上下文噪音、定期更新配置,采用效果和规模化速度显著提升。

我把 22 号端口开放在公网上长达 54 天,看看都有哪些“访客”找上门来

作者将伪装成 Ubuntu SSH 服务器的蜜罐开放 54 天,记录到 26.9 万次连接、7556 个攻击 IP、25.5 万次登录尝试;多数为自动化脚本,先用弱口令和默认凭据爆破,再执行 uname 等指纹探测,少数进入交互 shell 并部署 Mirai、反连载荷或尝试清痕。流量主要来自云 VPS 与被控家宽设备,Solana 节点成为明确目标,结论是公网 22 端口会在数秒内被持续扫描,SSH 必须禁用密码登录并使用密钥认证。

语音智能体中的记忆问题比你想象的更难

语音智能体的记忆不能沿用文本架构,500至800毫秒响应预算下,同步向量检索和实时总结会破坏对话节奏;可行方案是反转读写路径:通话前预加载用户画像、上次摘要和未结事项,通话中只查热缓存,语义检索和事实写入异步执行,通话后总结并在空闲期整合,最终记忆质量取决于预先准备和筛选,而非临场检索能力。

开源项目

re_gent:AI编程代智能体版本控制工具

re_gent 是面向 AI 编程代理的版本控制工具,用于记录代理每次工具调用造成的代码变更、来源与对话上下文,支持日志、逐行溯源、状态查看、审计和回退;其以 Go 构建,采用内容寻址存储、SQLite 索引和多会话 DAG 追踪,与 Git 互补。目前核心存储与 Hook 集成已完成,正开发分支探索、时间旅行和多工具适配能力。

Rowboat:本地优先的AI协作者工具

Rowboat是开源、本地优先的AI协作者,连接Gmail、日历和会议记录,将工作数据以Obsidian兼容Markdown存入本地并构建长期知识图谱,用于会议准备、邮件起草、文档生成和实时追踪主题;支持本地或托管模型及MCP外部工具集成,核心价值是让上下文可编辑、可备份、可迁移,降低平台锁定。

Open Design:Anthropic Claude Design 的开源替代方案

Open Design 对标 Claude Design,提供 Apache-2.0 开源、本地优先、可自托管的设计生成方案,自动接入 16 种编码代理或 BYOK API,结合 31 项技能与 72 套设计系统生成原型、演示、图像和视频,支持 Vercel 与 Electron 部署,降低云端锁定与模型绑定风险。

资源推荐

Tripo:AI驱动3D生成平台

Tripo是AI在线3D生成平台,可由文字、图片或草图生成可生产3D资产,并提供智能分割、4K PBR纹理、局部重绘、自动绑骨与动画等工具,支持游戏、3D打印、影视、AR/VR、建筑等场景,兼容Blender、Unity、Unreal等流程,已形成650万创作者、1亿模型的生态,核心价值是降低3D资产制作门槛并加速内容生产。

学习资料

从零构建大型语言模型

《Build a Large Language Model (From Scratch)》官方代码库提供从零实现GPT类LLM的完整教学代码,覆盖数据处理、注意力、预训练、分类微调、指令微调与推理,采用纯PyTorch、可在普通笔记本运行,并扩展Llama、Qwen、Gemma、MoE等架构,配套视频、自测、Docker、答疑及推理模型续作资源。

评论

(1)
未配置登录方式
暂无评论