中文智谱发布 GLM-5V-Turbo 多模态 Coding 大模型
智谱发布多模态编程基座模型GLM-5V-Turbo,可原生理解图片、视频、设计稿和复杂文档,并直接生成可运行代码,支持200k上下文及网页浏览等视觉工具调用;其在多模态Coding和GUI智能体任务中以小模型取得领先表现,已让AutoClaw获得读图表、采数据、出报告能力,推动编程从纯文本理解走向可视化自动化。
浏览 业界资讯 分类下的公开文章、摘要与延伸阅读。肖恩子的知识花园
中文智谱发布多模态编程基座模型GLM-5V-Turbo,可原生理解图片、视频、设计稿和复杂文档,并直接生成可运行代码,支持200k上下文及网页浏览等视觉工具调用;其在多模态Coding和GUI智能体任务中以小模型取得领先表现,已让AutoClaw获得读图表、采数据、出报告能力,推动编程从纯文本理解走向可视化自动化。
英文Anthropic因发布Claude Code 2.1.88时误附source map,导致其命令行应用全部源码外泄并被广泛传播,泄露内容约2000个TypeScript文件、超51万行代码,不含模型、用户数据或凭证;事件源于内部打包人为失误而非入侵,但已让开发者和竞争对手获得完整架构蓝图,也增加了被分析、模仿和挖掘漏洞的风险。
英文Axios 的 npm 版本 1.14.1 和 0.30.4 遭供应链投毒,被植入恶意依赖 [email protected],安装时会通过 postinstall 下发多阶段载荷,最终在 macOS、Windows、Linux 上部署可远程执行命令、窃取系统信息并维持持久化的木马;异常发布疑似绕过官方流程,使用相关版本范围的项目可能自动中招,应立即排查锁文件并回退到安全版本。
英文谷歌将Search Live扩展到所有已支持AI Mode的语言和地区,覆盖200多个国家和地区,用户可在Google应用中通过语音和摄像头与搜索进行实时多模态对话,也可从Google Lens直接进入;该功能由Gemini 3.1 Flash Live驱动,支持更自然的多语言交互,提升全球用户获取实时帮助和信息的效率。
英文Google为所有消费者账号上线迁移工具,用户可在Gemini设置页导入其他AI应用的记忆、偏好和聊天记录,方式包括复制提示词生成偏好摘要后粘贴到Gemini,或上传聊天记录ZIP文件,结果是无需从零开始,Gemini可直接继承既有上下文并继续对话,相关功能正陆续推送。
英文谷歌通过 Live API 预览发布 Gemini 3.1 Flash Live,面向开发者构建低延迟实时语音与视觉代理,重点提升噪声环境下任务完成率、复杂指令遵循、对话自然度和90多种语言支持,结论是其更适合生产级实时对话应用,并可即刻在 Gemini API 与 AI Studio 集成使用。
中文谷歌推出无训练向量量化算法TurboQuant,结合PolarQuant与QJL将大语言模型推理中的KV Cache内存需求压缩至少6倍,在Nvidia H100上把注意力计算提速最高8倍,并在长上下文测试中实现零精度损失,结果是可直接用于现有模型,显著降低AI部署成本并加速长上下文应用落地。
英文Claude Code推出Auto mode,用模型分类器替代大量人工审批,在沙箱高维护与完全跳过权限高风险之间提供折中,借助输入层提示注入探测和输出层两阶段动作审查,自动放行大多数低风险操作并拦截越权、误判、数据外传等危险行为,实测将正常操作误拦率降至0.4%,但对真实危险操作仍有17%漏拦,适合替代无权限模式,不适合高风险场景的人审。
英文OpenAI宣布关闭Sora视频生成应用及相关API,具体下线时间未定,原因是算力与战略重心转向世界模拟研究、机器人及更易盈利的企业级AI服务;Sora虽上线初期登顶应用商店,但用户安装和消费持续下滑,此次停运还导致迪士尼退出合作并取消10亿美元投资。
中文LiteLLM 的 PyPI 版本 1.82.7 和 1.82.8 被植入恶意代码,疑似经 Trivy 所在 CI/CD 链路入侵,安装或导入即可窃取密钥与凭证;PyPI 已隔离并删除相关版本,维护方轮换发布密钥、暂停发布并启动供应链审查。事件暴露其下游依赖面大、未锁版本和自动更新风险高,结论是必须强化沙箱隔离、OIDC 发布、版本锁定和镜像治理。