中文1
MiniCPM-o:强大的开源多模态LLM
开源项目
作者: OpenBMB
发表时间:
MiniCPM-o 4.5是9B开源多模态模型,可同时处理图像视频文本音频并端到端输出文本与语音,提供全双工流式交互和多语言OCR,支持多框架本地/服务器部署,配套手机端高效的MiniCPM-V 4.0,但全双工语音易错、偶混中英且Web演示可能高延迟。
浏览作者 OpenBMB 的公开文章、摘要与延伸阅读。肖恩子的知识花园
中文MiniCPM-o 4.5是9B开源多模态模型,可同时处理图像视频文本音频并端到端输出文本与语音,提供全双工流式交互和多语言OCR,支持多框架本地/服务器部署,配套手机端高效的MiniCPM-V 4.0,但全双工语音易错、偶混中英且Web演示可能高延迟。