摘要
本申请提出一种语音识别方法、装置、设备、介质及产品,该方法通过获取待进行语音识别的原始音频数据,原始音频数据中包括语音数据和非语音数据;确定原始音频数据中的音频结构信息,音频结构信息表征原始音频数据中不同类别的音频;不同类别的音频包括语音音频和至少一种非语音音频,至少一种非语音音频是多种不同类型的非语音音频中的至少一种;基于原始音频数据中的音频结构信息,对原始音频数据中的语音数据和非语音数据进行区分,并对语音数据进行语音识别,得到语音识别结果。本申请通过音频结构信息对各种类型的非语音数据进行精确区分,能够准确地区分语音和非语音,进而提高语音识别准确度。
技术关键词
语音识别模型
音频
语音识别方法
数据
非语音
样本
计算机程序指令
文本
处理器
计算机程序产品
存储器
电子设备
介质
系统为您推荐了相关专利信息
版权交易方法
哈希算法
多模态
分布式数字资产
音频特征提取
弧形显示屏
深度图像数据
交互控制方法
交互动作
惯性传感器数据
电网设备
气象环境参数
运维监控
波动特征
人工智能模型