摘要
本发明涉及音频处理技术领域,解决了现有技术中收集到的婴幼儿哭声受限于杂音的干扰,难以准确区分和提取出有效婴幼儿哭声的问题,提供了一种基于机器学习的婴幼儿哭声增强方法、装置及设备。该方法包括:获取第一音频数据,其中,所述第一音频数据包括至少一段含有婴幼儿哭声的音频数据;对所述第一音频数据进行预处理,得到第一音频数据对应的频谱图;将所述频谱图输入自编码器模型,输出所述第一音频数据中与婴幼儿哭声对应的音频特征信息;根据所述音频特征信息,对含有婴幼儿哭声的音频数据进行处理,得到增强后的第二音频数据。本发明有效地从嘈杂环境中提取并增强了婴幼儿哭声,显著提高了哭声信号的纯净度和识别率。
技术关键词
音频特征信息
编码器
计算机程序指令
时域音频信号
传播算法
正则化参数
重构
分段
采样率
特征提取模块
数据获取模块
表达式
处理器
存储器
矩阵
电子设备
系统为您推荐了相关专利信息
K均值算法
数据
K均值聚类算法
风量传感器
识别方法
滑动窗口
传感器
深度学习模型
车门控制方法
信号强度阈值
图像编码器
工业设备
序列
图像特征关系
神经网络模型
任务调度方法
深度Q网络
多通道
方位角
执行效能