英文Gemma 4:逐字节对比,能力最强的开源模型
谷歌发布开源模型家族Gemma 4,推出2B、4B、26B和31B版本,主打高推理能力、代理工作流、多模态、长上下文和140多语言支持,可在手机到工作站本地离线运行,并以Apache 2.0许可证开放,降低部署与微调门槛,提升开发者在低硬件成本下构建高性能AI应用的能力。
浏览最新公开文章、摘要与延伸阅读。肖恩子的知识花园
英文谷歌发布开源模型家族Gemma 4,推出2B、4B、26B和31B版本,主打高推理能力、代理工作流、多模态、长上下文和140多语言支持,可在手机到工作站本地离线运行,并以Apache 2.0许可证开放,降低部署与微调门槛,提升开发者在低硬件成本下构建高性能AI应用的能力。
英文OpenAI收购科技媒体平台TBPN,将其纳入战略部门,以扩大围绕AI的全球讨论与传播能力;TBPN保留节目运营、选题和嘉宾安排的编辑独立性,同时为OpenAI提供内容、传播和营销能力,目标是更高效地推动公众理解AI及其影响。
中文通义实验室发布Qwen3.6-Plus并接入阿里云百炼API,重点提升智能体编程稳定性、编码执行与百万级上下文能力,同时兼容主流开发工具并增强视觉到执行的多模态闭环。其以更低成本提供更稳的Agent开发体验,进一步推动复杂编程与长程任务落地。
中文智谱发布多模态编程基座模型GLM-5V-Turbo,可原生理解图片、视频、设计稿和复杂文档,并直接生成可运行代码,支持200k上下文及网页浏览等视觉工具调用;其在多模态Coding和GUI智能体任务中以小模型取得领先表现,已让AutoClaw获得读图表、采数据、出报告能力,推动编程从纯文本理解走向可视化自动化。
英文文章基于源码拆解Claude Code的实际运行机制,聚焦用户输入后系统如何进入代理循环、调用50多种工具并进行多代理协同,进一步揭示其尚未发布的功能线索。Claude Code并非单一对话程序,而是具备复杂编排与扩展能力的代理式开发系统。
英文METR提出“时间跨度”指标衡量AI独立完成长软件任务的能力,基于170项任务测试发现,大模型可胜任任务对应的人类工作时长约每7个月翻倍,已从秒级提升到数小时至约12小时,按趋势未来数年或可处理相当于专家数周的任务;但真实软件工作更混乱,自动化基准与现实可用性存在明显差距,现有结论应谨慎外推。
中文OpenClaw官方中国ClawHub站,为中国开发者提供Clawhub社区高质量Agent Skill的镜像加速服务。
英文Anthropic因发布Claude Code 2.1.88时误附source map,导致其命令行应用全部源码外泄并被广泛传播,泄露内容约2000个TypeScript文件、超51万行代码,不含模型、用户数据或凭证;事件源于内部打包人为失误而非入侵,但已让开发者和竞争对手获得完整架构蓝图,也增加了被分析、模仿和挖掘漏洞的风险。
英文Axios 的 npm 版本 1.14.1 和 0.30.4 遭供应链投毒,被植入恶意依赖 [email protected],安装时会通过 postinstall 下发多阶段载荷,最终在 macOS、Windows、Linux 上部署可远程执行命令、窃取系统信息并维持持久化的木马;异常发布疑似绕过官方流程,使用相关版本范围的项目可能自动中招,应立即排查锁文件并回退到安全版本。