多方言语音识别系统及方法

AITNT
正文
推荐专利
多方言语音识别系统及方法
申请号:CN202510401726
申请日期:2025-04-01
公开号:CN120260567A
公开日期:2025-07-04
类型:发明专利
摘要
本申请涉及语音识别技术领域,尤其涉及一种多方言语音识别系统及方法,包括接收输入的音频并提取音频特征,将音频特征同时输入到普通话链路识别模型和方言链路识别模型,方言链路识别模型包括多方言识别模型和语种分类模型,输出识别结果,基于语种分类模型的输出结果进行第一重决策,若是输出结果为方言,直接采用方言链路的识别结果作为最终结果。若是输出结果为普通话,则进入第二重决策判断,在第二重决策判断中,调用语义模型分别对普通话链路识别结果和方言链路识别结果进行语义置信度计算,采用语义置信度高的识别结果作为最终结果。本申请能够通过普通话链路和方言链路的并行处理,优化语音识别的准确性和适应性。
技术关键词
语音识别系统 方言语音识别方法 链路 音频特征 决策 语义 子模块 增强子 语音识别技术 识别模块 数据更新 程序 处理器 输入模块 可读存储介质 存储器
系统为您推荐了相关专利信息
1
一种混合波束成形的混合多址系统传输及优化方法
混合多址系统 模拟波束成形矩阵 混合波束成形方法 系统优化方法 传输方法
2
基于机器学习的网络安全威胁检测方法及系统
异常流量 网络安全检测系统 网络接口 网络安全威胁 频域波动特征
3
基于情感识别的客服应答排队方法和客服应答排队装置
神经网络模型 排队方法 分布式设备 情感特征 客服
4
基于遗传算法的数据保护方法
数据保护策略 数据保护方法 遗传算法 小世界网络 决策
5
无人机边缘网络控制方法、无人机及计算机程序产品
无人机 网络控制方法 飞行模型 决策 终端
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号