一种噪声环境中语音数据库的智能构建系统及方法

正文

推荐专利

申请号：CN202411474845

申请日期：2024-10-22

公开号：CN119380716A

公开日期：2025-01-28

类型：发明专利

摘要

本发明涉及语音数据库技术领域，且公开了一种噪声环境中语音数据库的智能构建方法，包括以下步骤：步骤一：从多种噪声环境中采集语音和视频样本；步骤二：对采集的语音样本进行预处理，包括通过频谱减法减少背景噪声对语音信号的影响。本发明通过在噪声环境中采集语音数据和视频数据，然后将这些上传到预处理模块中，采用声音活动检测算法来区分语音信号与非语音信号，如此能够移除无声片段，减小后续语音处理的范围，通过使用卷积神经网络算法提取视频数据中说话人的口型特征，并且结合光流法来捕捉口型动态变化，有助于更准确地识别和分析说话人口型的特征，从而辅助识别语音数据。

技术关键词

智能构建方法深度学习模型声音活动检测卷积神经网络算法校验模块构建系统深度神经网络自然语言噪声估计方法输出模块识别语音数据语音识别算法背景噪声视频数据库技术样本

系统为您推荐了相关专利信息

一种端子排电路图智能识别方法

端子排智能识别方法短接片表格图片

基于大数据模型的机场公共交通预分配处理系统及方法

旅客资源分配智能优化算法大数据处理技术深度学习模型

一种基于晶体图卷积神经网络的微波介质陶瓷介电常数预测方法

晶体 Softmax函数微波介质陶瓷材料卷积神经网络模型数据

教学资源编码的自适应优化及资源个性化推荐方法及系统

动态个性化推荐引擎半监督学习模型资源库节点特征

玉米植株群体冠层三维模型构建方法及系统

点云三维模型构建方法语义分割模型网格模型叶片

一种噪声环境中语音数据库的智能构建系统及方法

站点导航

APP 下载