语音识别中多发音问题的处理的方法、装置、设备及介质

AITNT
正文
推荐专利
语音识别中多发音问题的处理的方法、装置、设备及介质
申请号:CN202410913691
申请日期:2024-07-09
公开号:CN118748009A
公开日期:2024-10-08
类型:发明专利
摘要
本申请涉及到语音识别技术领域,公开了语音识别中多发音问题的处理的方法、装置、设备及介质,其方法包括:构建文本语料,并将所述文本语料中包含的单词序列转为音素序列;基于所述音素序列,通过音素拼接构造伪单词;使用伪单词替换发音词典中的单词;将所有伪单词按照发音词典的格式整理成伪单词列表,并更新发音词典;使用更新后的所述发音词典对语音识别模型进行区分性训练。本申请解决了命令词识别过程中多发音问题导致的识别准确性下降的问题,通过伪单词的构造和替换,显著减少了网络模型占用的空间和解码所需的空间,使得该方法能够在资源极低的设备上进行部署。
技术关键词
发音词典 语音识别模型 序列 文本 列表 格式 语音识别技术 可读存储介质 存储计算机程序 处理器 模块 分词 解码 命令 校正 存储器
系统为您推荐了相关专利信息
1
文本优化方法、计算机设备、存储介质和程序产品
大语言模型 计算机设备 文本处理方法 处理器 可读存储介质
2
一种基于人工智能的智慧消防运维平台
运维平台 智慧消防 火灾检测系统 风险 实时监测数据
3
数据推理方法及用于数据推理的系统
智能模型 列表 数据推理方法 矩阵 精度
4
一种面向无人仓货架的货物自动盘点方法及系统
盘点方法 无人仓 卡尔曼滤波 算法 灰度共生矩阵
5
语音识别方法、装置、电子设备、可读存储介质及车辆
语音识别模型 训练集 样本 识别语音数据 语音识别方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号