摘要
本申请涉及一种语音识别方法、装置、计算机设备和存储介质,用以提升语音识别所得语音信息的准确性。该方法包括:获取待处理数据,并向目标模型输入所述待处理数据;其中,所述待处理数据包括多个模态数据,所述模态数据包括语音信息,且至少两个模态的所述模态数据对应于同一时间片段;通过所述目标模型,确定所述模态数据的模态特征、以及由同一所述时间片段的模态子特征组成的特征集;其中,所述模态特征包括多个所述模态子特征;确定与所述特征集中所述模态子特征对应的第一权重,并基于所述第一权重,融合所述特征集中的所述模态子特征,得到融合特征;基于多个所述时间片段的所述融合特征,确定所述语音信息。
技术关键词
模态特征
描述符
语音识别方法
融合特征
数据
sigmoid函数
卷积特征
计算机设备
语音识别装置
通道
特征切片
音频
处理器
视频
输入模块
可读存储介质
存储器
图片
系统为您推荐了相关专利信息
协作系统
作业方法
网络资源需求
检测平台
网络切片技术
序列特征
融合特征
动态反馈机制
关节
视觉传感器
智能预警方法
三维场景模型
带电作业
距离监测
动态路径优化
答案
计算机程序指令
负载均衡优化
分类网络
计算机程序产品
智能管控方法
Lyapunov指数
混沌优化算法
实时数据
智能管控系统