摘要
本发明涉及音频处理技术领域,解决了现有技术中收集到的婴幼儿哭声受限于杂音的干扰,难以准确区分和提取出有效婴幼儿哭声的问题,提供了一种基于机器学习的婴幼儿哭声增强方法、装置及设备。该方法包括:获取第一音频数据,其中,所述第一音频数据包括至少一段含有婴幼儿哭声的音频数据;对所述第一音频数据进行预处理,得到第一音频数据对应的频谱图;将所述频谱图输入自编码器模型,输出所述第一音频数据中与婴幼儿哭声对应的音频特征信息;根据所述音频特征信息,对含有婴幼儿哭声的音频数据进行处理,得到增强后的第二音频数据。本发明有效地从嘈杂环境中提取并增强了婴幼儿哭声,显著提高了哭声信号的纯净度和识别率。
技术关键词
音频特征信息
编码器
计算机程序指令
时域音频信号
传播算法
正则化参数
重构
分段
采样率
特征提取模块
数据获取模块
表达式
处理器
存储器
矩阵
电子设备
系统为您推荐了相关专利信息
地理信息获取方法
波动特征
地理信息获取系统
气象
滤波算法
电力金具
图像识别方法
卷积解码器
卷积编码器
图像采集设备
可见光图像
融合方法
编码器模块
融合策略
解码器
非线性系统
非线性动力系统
识别方法
深度学习模型
条件生成对抗网络