中文7
VibeVoice:微软开源的语音AI模型
开源项目
实时流式语音合成+3
作者: Microsoft
发表时间:
VibeVoice是微软开源的前沿语音AI模型家族,包含语音识别(ASR)和语音合成(TTS)两大方向。核心创新采用7.5Hz超低帧率的连续语音分词器,结合大语言模型与扩散模型实现高效长序列处理。
浏览 开源项目 分类下的公开文章、摘要与延伸阅读。肖恩子的知识花园
中文VibeVoice是微软开源的前沿语音AI模型家族,包含语音识别(ASR)和语音合成(TTS)两大方向。核心创新采用7.5Hz超低帧率的连续语音分词器,结合大语言模型与扩散模型实现高效长序列处理。
中文Microsoft Agent Framework 是微软面向 Python 与 .NET 的 AI 智能体开发框架,提供从单智能体到多智能体工作流的构建、编排与部署能力,核心包括图编排、可观测性、中间件、多模型接入和开发调试工具,目标是统一多语言智能体开发流程并提升可扩展性与落地效率。