语音识别的方法、服务器、存储介质和程序产品

正文

推荐专利

申请号：CN202410753634

申请日期：2024-06-12

公开号：CN118645105A

公开日期：2024-09-13

类型：发明专利

摘要

本申请提供一种语音识别的方法、服务器、存储介质和程序产品。本申请的方法，在对语音数据进行语音识别时，通过语音识别模型提取语音数据的语音特征，对语音特征进行CTC处理，实现语音与文本的对齐，生成一个初步的文本序列预测结果，该初步的文本序列预测结果的长度也即是最终语音识别结果的长度；进一步地，根据初步的文本序列预测结果和语音特征，解码生成语音数据的语音识别结果，实现非自回归的语音识别，通过一步解码即可生成最终的语音识别结果，大大节省了解码输出语音识别结果的时间开销，提升了语音识别的速度和效率，并且可以取得较高的识别准确率。

技术关键词

语音特征语音识别模型文本样本时序序列声学特征标记数据语音识别方法计算机执行指令后处理模块特征提取模块解码模块编码模块服务器处理器可读存储介质

系统为您推荐了相关专利信息

文本实体联合关系抽取模型的训练方法、装置及计算机可读存储介质

实体关系抽取模型融合特征文本上下文特征

自适应类别平衡的胎儿心脏超声图像半监督分类系统

胎儿心脏超声影像数据图像半监督分类融合特征误差

基于服装语义渐进式引导学习的换衣行人重识别方法

行人特征查询特征服装重识别方法训练集

基于BIM技术的工程预算实时监控与调整方法

BIM技术指标样本项目阶段

一种电气图元器件识别模型训练方法

识别模型训练方法元器件电气训练集电器元件

语音识别的方法、服务器、存储介质和程序产品

站点导航

APP 下载