一种语音识别方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
一种语音识别方法、装置、电子设备及存储介质
申请号:CN202510529488
申请日期:2025-04-25
公开号:CN120279918A
公开日期:2025-07-08
类型:发明专利
摘要
本发明提供一种语音识别方法、装置、电子设备及存储介质,所述方法包括:获取语音数据集,并提取语音数据集的音频特征矩阵;利用与语音数据对应领域相对应的转录文本进行特征提取,得到对应的文本特征矩阵;针对同一领域的音频特征矩阵和文本特征矩阵,将音频特征矩阵和所述文本特征矩阵中的特征进行跨模态特征对齐,得到对齐特征;基于对齐特征进行处理,确定综合损失函数;利用综合损失函数优化初始语音识别模型,得到目标语音识别模型,以便基于目标语音识别模型对用户输入的待识别语音进行处理,得到与待识别语音对应的转录文本。从而提升语音识别模型在不同领域场景下的识别性能。
技术关键词
语音识别模型 音频特征 文本 损失函数优化 语音识别方法 矩阵 跨模态 数据 序列 电子设备 语音识别装置 方向盘控制 对齐模块 存储器 处理器 程序 蒸馏
系统为您推荐了相关专利信息
1
数字人语音交互的处理方法、装置、电子设备和介质
音频 数据 语音识别模型 文本 深度学习网络模型
2
虚拟电子宠物的深层交互实现方法与系统
电子宠物 交互系统 文本 云服务器 动态负载分配
3
一种基于深度学习的正畸多模态数据的质量评估方法及系统
多模态 文本 数据 样本 Softmax分类器
4
一种面向政务大模型检测的方法、系统及设备
答案 文本 政务 关键词 参数
5
基于学习机的意图识别处理方法、装置及终端
意图识别 学习机 文本 大语言模型 分支
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号