英文Microsoft 宣布推出3款全新的世界级 MAI 模型,现已在 Foundry 平台上线
微软发布并在Foundry上线三款MAI模型:语音转写MAI-Transcribe-1、语音生成MAI-Voice-1、图像生成MAI-Image-2,主打更高准确率与生成质量、更快速度和更低成本,并支持自定义语音、企业级安全治理及规模化部署,意在推动开发者和微软自有产品加速采用。
浏览 业界资讯 分类下的公开文章、摘要与延伸阅读。肖恩子的知识花园
英文微软发布并在Foundry上线三款MAI模型:语音转写MAI-Transcribe-1、语音生成MAI-Voice-1、图像生成MAI-Image-2,主打更高准确率与生成质量、更快速度和更低成本,并支持自定义语音、企业级安全治理及规模化部署,意在推动开发者和微软自有产品加速采用。
英文谷歌发布开源模型家族Gemma 4,推出2B、4B、26B和31B版本,主打高推理能力、代理工作流、多模态、长上下文和140多语言支持,可在手机到工作站本地离线运行,并以Apache 2.0许可证开放,降低部署与微调门槛,提升开发者在低硬件成本下构建高性能AI应用的能力。
英文OpenAI收购科技媒体平台TBPN,将其纳入战略部门,以扩大围绕AI的全球讨论与传播能力;TBPN保留节目运营、选题和嘉宾安排的编辑独立性,同时为OpenAI提供内容、传播和营销能力,目标是更高效地推动公众理解AI及其影响。
中文通义实验室发布Qwen3.6-Plus并接入阿里云百炼API,重点提升智能体编程稳定性、编码执行与百万级上下文能力,同时兼容主流开发工具并增强视觉到执行的多模态闭环。其以更低成本提供更稳的Agent开发体验,进一步推动复杂编程与长程任务落地。
中文智谱发布多模态编程基座模型GLM-5V-Turbo,可原生理解图片、视频、设计稿和复杂文档,并直接生成可运行代码,支持200k上下文及网页浏览等视觉工具调用;其在多模态Coding和GUI智能体任务中以小模型取得领先表现,已让AutoClaw获得读图表、采数据、出报告能力,推动编程从纯文本理解走向可视化自动化。
英文Anthropic因发布Claude Code 2.1.88时误附source map,导致其命令行应用全部源码外泄并被广泛传播,泄露内容约2000个TypeScript文件、超51万行代码,不含模型、用户数据或凭证;事件源于内部打包人为失误而非入侵,但已让开发者和竞争对手获得完整架构蓝图,也增加了被分析、模仿和挖掘漏洞的风险。
英文Axios 的 npm 版本 1.14.1 和 0.30.4 遭供应链投毒,被植入恶意依赖 [email protected],安装时会通过 postinstall 下发多阶段载荷,最终在 macOS、Windows、Linux 上部署可远程执行命令、窃取系统信息并维持持久化的木马;异常发布疑似绕过官方流程,使用相关版本范围的项目可能自动中招,应立即排查锁文件并回退到安全版本。
英文谷歌将Search Live扩展到所有已支持AI Mode的语言和地区,覆盖200多个国家和地区,用户可在Google应用中通过语音和摄像头与搜索进行实时多模态对话,也可从Google Lens直接进入;该功能由Gemini 3.1 Flash Live驱动,支持更自然的多语言交互,提升全球用户获取实时帮助和信息的效率。
英文Google为所有消费者账号上线迁移工具,用户可在Gemini设置页导入其他AI应用的记忆、偏好和聊天记录,方式包括复制提示词生成偏好摘要后粘贴到Gemini,或上传聊天记录ZIP文件,结果是无需从零开始,Gemini可直接继承既有上下文并继续对话,相关功能正陆续推送。
英文谷歌通过 Live API 预览发布 Gemini 3.1 Flash Live,面向开发者构建低延迟实时语音与视觉代理,重点提升噪声环境下任务完成率、复杂指令遵循、对话自然度和90多种语言支持,结论是其更适合生产级实时对话应用,并可即刻在 Gemini API 与 AI Studio 集成使用。