一种跨语种语音识别方法、系统、设备及存储介质

AITNT
正文
推荐专利
一种跨语种语音识别方法、系统、设备及存储介质
申请号:CN202511031151
申请日期:2025-07-25
公开号:CN120808756A
公开日期:2025-10-17
类型:发明专利
摘要
本申请公开了一种跨语种语音识别方法、系统、设备及存储介质,本方法通过将训练语音进行预处理,得到训练语音帧序列;从训练语音帧序列中提取内容表征、说话人表征以及音高表征;根据内容表征、说话人表征以及音高表征进行语音重构,得到目标语种语音;基于训练语音,根据目标语种语音构建得到目标语种语音识别模型;响应目标语种识别指令,获取目标语音;将目标语音输入至目标语种语音识别模型,得到目标语种语音识别模型输出的识别结果,能够通过跨语种特征解耦与自监督迁移机制,在极低标注数据条件下实现方言声学特性精准建模,显著提升桂柳话复杂声调与特色词汇的识别鲁棒性,实现方言场景下的高效泛化应用。
技术关键词
语音识别模型 语音识别方法 语种识别 序列 重构 计算机可执行指令 密集特征 韵律特征 调控策略 解码器 声学特征 频谱特征 损失函数优化 语音识别系统 编码器参数 深度学习网络 阶段 可读存储介质
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号