一种噪声环境中语音数据库的智能构建系统及方法

AITNT
正文
推荐专利
一种噪声环境中语音数据库的智能构建系统及方法
申请号:CN202411474845
申请日期:2024-10-22
公开号:CN119380716A
公开日期:2025-01-28
类型:发明专利
摘要
本发明涉及语音数据库技术领域,且公开了一种噪声环境中语音数据库的智能构建方法,包括以下步骤:步骤一:从多种噪声环境中采集语音和视频样本;步骤二:对采集的语音样本进行预处理,包括通过频谱减法减少背景噪声对语音信号的影响。本发明通过在噪声环境中采集语音数据和视频数据,然后将这些上传到预处理模块中,采用声音活动检测算法来区分语音信号与非语音信号,如此能够移除无声片段,减小后续语音处理的范围,通过使用卷积神经网络算法提取视频数据中说话人的口型特征,并且结合光流法来捕捉口型动态变化,有助于更准确地识别和分析说话人口型的特征,从而辅助识别语音数据。
技术关键词
智能构建方法 深度学习模型 声音活动检测 卷积神经网络算法 校验模块 构建系统 深度神经网络 自然语言 噪声估计方法 输出模块 识别语音数据 语音识别算法 背景噪声 视频 数据库技术 样本
系统为您推荐了相关专利信息
1
一种端子排电路图智能识别方法
端子排 智能识别方法 短接片 表格 图片
2
基于大数据模型的机场公共交通预分配处理系统及方法
旅客 资源分配 智能优化算法 大数据处理技术 深度学习模型
3
一种基于晶体图卷积神经网络的微波介质陶瓷介电常数预测方法
晶体 Softmax函数 微波介质陶瓷材料 卷积神经网络模型 数据
4
教学资源编码的自适应优化及资源个性化推荐方法及系统
动态 个性化推荐引擎 半监督学习模型 资源库 节点特征
5
玉米植株群体冠层三维模型构建方法及系统
点云 三维模型构建方法 语义分割模型 网格模型 叶片
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号