一种语音识别方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202510529488

申请日期：2025-04-25

公开号：CN120279918A

公开日期：2025-07-08

类型：发明专利

摘要

本发明提供一种语音识别方法、装置、电子设备及存储介质，所述方法包括：获取语音数据集，并提取语音数据集的音频特征矩阵；利用与语音数据对应领域相对应的转录文本进行特征提取，得到对应的文本特征矩阵；针对同一领域的音频特征矩阵和文本特征矩阵，将音频特征矩阵和所述文本特征矩阵中的特征进行跨模态特征对齐，得到对齐特征；基于对齐特征进行处理，确定综合损失函数；利用综合损失函数优化初始语音识别模型，得到目标语音识别模型，以便基于目标语音识别模型对用户输入的待识别语音进行处理，得到与待识别语音对应的转录文本。从而提升语音识别模型在不同领域场景下的识别性能。

技术关键词

语音识别模型音频特征文本损失函数优化语音识别方法矩阵跨模态数据序列电子设备语音识别装置方向盘控制对齐模块存储器处理器程序蒸馏

系统为您推荐了相关专利信息

数字人语音交互的处理方法、装置、电子设备和介质

音频数据语音识别模型文本深度学习网络模型

虚拟电子宠物的深层交互实现方法与系统

电子宠物交互系统文本云服务器动态负载分配

一种基于深度学习的正畸多模态数据的质量评估方法及系统

多模态文本数据样本 Softmax分类器

一种面向政务大模型检测的方法、系统及设备

答案文本政务关键词参数

基于学习机的意图识别处理方法、装置及终端

意图识别学习机文本大语言模型分支

一种语音识别方法、装置、电子设备及存储介质

站点导航

APP 下载