摘要
本发明涉及音频处理技术领域,解决了现有技术中收集到的婴幼儿哭声受限于杂音的干扰,难以准确区分和提取出有效婴幼儿哭声的问题,提供了一种基于机器学习的婴幼儿哭声增强方法、装置及设备。该方法包括:获取第一音频数据,其中,所述第一音频数据包括至少一段含有婴幼儿哭声的音频数据;对所述第一音频数据进行预处理,得到第一音频数据对应的频谱图;将所述频谱图输入自编码器模型,输出所述第一音频数据中与婴幼儿哭声对应的音频特征信息;根据所述音频特征信息,对含有婴幼儿哭声的音频数据进行处理,得到增强后的第二音频数据。本发明有效地从嘈杂环境中提取并增强了婴幼儿哭声,显著提高了哭声信号的纯净度和识别率。
技术关键词
音频特征信息
编码器
计算机程序指令
时域音频信号
传播算法
正则化参数
重构
分段
采样率
特征提取模块
数据获取模块
表达式
处理器
存储器
矩阵
电子设备
系统为您推荐了相关专利信息
漏洞检测方法
大语言模型
前馈神经网络
注意力机制
矩阵
临近预报方法
气象观测数据
雷达回波数据
地面自动气象站
闪电定位数据
视频编码方法
生成可视化界面
感兴趣
显著性检测算法
运动检测算法