全部文章
浏览最新公开文章、摘要与延伸阅读。肖恩子的知识花园
英文通过 API 中的新模型推进语音智能发展
OpenAI在API推出三款实时语音模型:GPT‑Realtime‑2支持GPT‑5级语音推理、工具调用和128K上下文,GPT‑Realtime‑Translate支持70多种输入语言实时译成13种语言,GPT‑Realtime‑Whisper提供低延迟流式转写,面向开发者构建可听、可推理、可翻译、可转写并实时执行任务的语音应用,现已开放并公布定价。
英文我们要为新发明等待多久?
作者用Claude评估190项重大发明在前置知识和技术具备后最早可出现的时间,166项获得估算并经抽查验证总体可信。结果显示,多数发明并未长期“沉睡”,64%最早可行时间距实际发明不超50年,1900年后差距进一步收窄;长期延迟主要集中在早期和医疗领域,发明瓶颈更多来自技术成熟度而非科学理论。
中文全新功能:从每个任务中学习的 Project
Manus 新增 Project 学习能力,可从已完成任务对话中识别可复用决策、流程、术语、示例、文件和技能改进,生成 Project 指令、文件或技能更新建议,并仅在用户审批后生效,使团队后续任务基于最新共享上下文启动,减少重复说明,避免经验停留在聊天记录中。
英文Claude 托管代理的新功能:梦想、成果与多代理协同
Anthropic在Claude Managed Agents推出研究预览版dreaming,并开放outcomes、多智能体编排和webhooks;dreaming复盘历史会话与记忆以提炼模式、纠错并优化记忆,outcomes用评分标准驱动自检迭代,多智能体并行拆解复杂任务,整体提升代理长期学习、质量控制和复杂任务执行能力。
英文职场中“看起来很忙”
生成式AI在职场切断了“产出质量”与“个人能力”的关联,使非专业者能制造看似专业的代码、文档和方案,却无法判断其正确性;组织因追求效率放任这种跨领域伪专业化,导致内部信息噪声、无效流程和责任风险上升。AI应限于可验证、由人判断的辅助任务,真正的竞争力将回到可信专业能力。
裁员将持续进行,直到我们学会使用人工智能
科技公司裁员并非因AI直接替代员工,而是AI让代码等“投入”暴增,却未同步转化为功能、收入等“结果”,还推高token成本并放大组织协同摩擦;裁员短期可抵消AI开支、减少对齐成本,因此在企业学会把AI效率转化为真实业务增长前,相关裁员仍会持续。
中文DeepSeek-TUI:DeepSeek V4 编码智能体
DeepSeek-TUI 是基于 Rust 的终端 DeepSeek V4 编码智能体,提供键盘驱动界面、自动模型与思考级别选择、流式推理、文件/Shell/Git/搜索等工具、1M Token 上下文、三种执行模式、会话恢复、LSP 诊断和成本追踪,并支持多模型提供商、HTTP/SSE 无头调用、技能安装、本地化与跨会话记忆。
中文Understand-Anything:开源的代码库与知识库可视化工具
Understand-Anything 将代码库或知识库转换为交互式知识图谱,兼容 9 类 AI 编码平台,支持结构探索、语义搜索、变更影响分析和团队共享,帮助开发者快速理解大型项目。
中文agency-agents:AI智能体集合库
The Agency开源144个专业AI智能体,覆盖12个部门,内置角色人格、交付物、流程与指标,支持11种主流AI工具一键部署,定位为可生产使用的专业化多智能体协作系统。
