在AI教育产品快速增多的背景下,不少应用已经可以实现对话、讲解、生成练习题,甚至模拟教师互动。但在口语学习场景中,“能聊天”并不等同于“会教口语”。学生需要的不只是简单反馈,而是能够明确知道自己在哪个音素、单词或发音习惯上存在问题,并获得进一步练习建议。
近日,智能语音技术公司驰声CHIVOX发布语音评测MCP服务,面向教育智能体、AI口语陪练、AI外教等产品,提供语音评测、发音诊断及个性化练习建议等能力。
据了解,CHIVOX MCP将驰声的语音评测、语音分析和多维度反馈能力封装为标准化接口,可开放给GPT、Claude、Gemini、豆包、通义千问、DeepSeek等国内外主流大语言模型调用,为教育智能体接入专业语音评测能力。
测评的具体模式为,用户提交录音后,大语言模型可调用驰声语音评测工具,获得包括总分、准确度、完整度、流利度、韵律、语速、错误诊断等在内的音素级评测数据。大语言模型再基于这些结构化数据,自动生成发音诊断、实时纠音指导和个性化练习方案,从而形成“评测—诊断—个性化练习”的学习闭环。

在接入方式上,CHIVOX MCP支持MCP与Function Calling双协议架构。其中,MCP模式支持标准MCP协议,可集成至支持MCP的AI客户端、IDE与Agent框架;Function Calling模式兼容通用函数调用规范,协议层采用HTTP/WebSocket,不依赖MCP SDK,可适配移动端、小程序、传统后端等场景。
驰声创始人兼CEO林远东表示,驰声积累了近20年的智能语音技术和5000万小时口语训练数据库,相关能力过去主要以API形式输出。此次发布CHIVOX MCP服务后,这些能力可以被智能体灵活调用和编排,“这是从能力开放到生态开放的关键一步。”