模型训练方法、语音识别方法、装置及存储介质

正文

推荐专利

申请号：CN202411720947

申请日期：2024-11-27

公开号：CN119920241A

公开日期：2025-05-02

类型：发明专利

摘要

本申请提供了一种模型训练方法、语音识别方法、装置及存储介质，包括：获取多个语音图像对数据，多个语音图像对数据中的目标语音图像对数据包括：对应内容一致的目标语音数据和目标图像数据；针对多个语音图像对数据中的任一目标语音图像对数据，通过语音特征提取模型对目标语音数据进行特征提取，得到目标语音数据的语音特征，语音特征包括：语音全局特征和/或语音局部特征；通过视觉特征提取模型对目标图像数据进行特征提取，得到目标图像数据的图像特征，图像特征包括：图像全局特征和/或图像局部特征；根据语音特征和图像特征，训练语音特征提取模型，提高语音特征的提取准确性和语音识别结果的准确性。

技术关键词

语音特征提取识别语音数据语音识别模型图像全局特征图像局部特征视觉特征提取语音识别方法模型训练方法特征提取模块噪声图像计算机程序产品语音识别装置模型训练装置样本电子设备处理器

系统为您推荐了相关专利信息

一种多模态目标数据智能化处理系统

现场视频图像图像局部特征数据存储管理视频帧分析模块

基于大模型与检索增强生成的长视频多模态理解与问答方法及系统

多模态语音识别模型记忆带时间问答方法

跨模态检索模型的训练方法以及遥感图像文本检索方法

样本文本检索方法文本编码器图像全局特征图像局部特征

一种基于语音识别的机器人控制方法及系统

机器人控制方法构建语音识别模型声道多特征信息融合特征值

一种语音识别方法

识别语音信号低功耗嵌入式设备样本语音识别方法语音特征

模型训练方法、语音识别方法、装置及存储介质

站点导航

APP 下载