语音识别中多发音问题的处理的方法、装置、设备及介质

正文

推荐专利

申请号：CN202410913691

申请日期：2024-07-09

公开号：CN118748009A

公开日期：2024-10-08

类型：发明专利

摘要

本申请涉及到语音识别技术领域，公开了语音识别中多发音问题的处理的方法、装置、设备及介质，其方法包括：构建文本语料，并将所述文本语料中包含的单词序列转为音素序列；基于所述音素序列，通过音素拼接构造伪单词；使用伪单词替换发音词典中的单词；将所有伪单词按照发音词典的格式整理成伪单词列表，并更新发音词典；使用更新后的所述发音词典对语音识别模型进行区分性训练。本申请解决了命令词识别过程中多发音问题导致的识别准确性下降的问题，通过伪单词的构造和替换，显著减少了网络模型占用的空间和解码所需的空间，使得该方法能够在资源极低的设备上进行部署。

技术关键词

发音词典语音识别模型序列文本列表格式语音识别技术可读存储介质存储计算机程序处理器模块分词解码命令校正存储器

系统为您推荐了相关专利信息

文本优化方法、计算机设备、存储介质和程序产品

大语言模型计算机设备文本处理方法处理器可读存储介质

一种基于人工智能的智慧消防运维平台

运维平台智慧消防火灾检测系统风险实时监测数据

数据推理方法及用于数据推理的系统

智能模型列表数据推理方法矩阵精度

一种面向无人仓货架的货物自动盘点方法及系统

盘点方法无人仓卡尔曼滤波算法灰度共生矩阵

语音识别方法、装置、电子设备、可读存储介质及车辆

语音识别模型训练集样本识别语音数据语音识别方法

语音识别中多发音问题的处理的方法、装置、设备及介质

站点导航

APP 下载