摘要
本发明涉及语音数据库技术领域,且公开了一种噪声环境中语音数据库的智能构建方法,包括以下步骤:步骤一:从多种噪声环境中采集语音和视频样本;步骤二:对采集的语音样本进行预处理,包括通过频谱减法减少背景噪声对语音信号的影响。本发明通过在噪声环境中采集语音数据和视频数据,然后将这些上传到预处理模块中,采用声音活动检测算法来区分语音信号与非语音信号,如此能够移除无声片段,减小后续语音处理的范围,通过使用卷积神经网络算法提取视频数据中说话人的口型特征,并且结合光流法来捕捉口型动态变化,有助于更准确地识别和分析说话人口型的特征,从而辅助识别语音数据。
技术关键词
智能构建方法
深度学习模型
声音活动检测
卷积神经网络算法
校验模块
构建系统
深度神经网络
自然语言
噪声估计方法
输出模块
识别语音数据
语音识别算法
背景噪声
视频
数据库技术
样本
系统为您推荐了相关专利信息
旅客
资源分配
智能优化算法
大数据处理技术
深度学习模型
晶体
Softmax函数
微波介质陶瓷材料
卷积神经网络模型
数据
动态
个性化推荐引擎
半监督学习模型
资源库
节点特征
点云
三维模型构建方法
语义分割模型
网格模型
叶片