基于机器学习的婴幼儿哭声增强方法、装置及设备

正文

推荐专利

申请号：CN202411080693

申请日期：2024-08-08

公开号：CN118609605B

公开日期：2024-10-18

类型：发明专利

摘要

本发明涉及音频处理技术领域，解决了现有技术中收集到的婴幼儿哭声受限于杂音的干扰，难以准确区分和提取出有效婴幼儿哭声的问题，提供了一种基于机器学习的婴幼儿哭声增强方法、装置及设备。该方法包括：获取第一音频数据，其中，所述第一音频数据包括至少一段含有婴幼儿哭声的音频数据；对所述第一音频数据进行预处理，得到第一音频数据对应的频谱图；将所述频谱图输入自编码器模型，输出所述第一音频数据中与婴幼儿哭声对应的音频特征信息；根据所述音频特征信息，对含有婴幼儿哭声的音频数据进行处理，得到增强后的第二音频数据。本发明有效地从嘈杂环境中提取并增强了婴幼儿哭声，显著提高了哭声信号的纯净度和识别率。

技术关键词

音频特征信息编码器计算机程序指令时域音频信号传播算法正则化参数重构分段采样率特征提取模块数据获取模块表达式处理器存储器矩阵电子设备

系统为您推荐了相关专利信息

基于GIS的地理信息获取方法及系统

地理信息获取方法波动特征地理信息获取系统气象滤波算法

一种电力金具遮挡图像识别方法及系统

电力金具图像识别方法卷积解码器卷积编码器图像采集设备

多码道绝对式编码器位置检测方法

位置检测方法编码器单周期细分方法周期性

基于掩码先验的两阶段红外与可见光图像融合方法

可见光图像融合方法编码器模块融合策略解码器

一种基于动力学嵌入GAN的参数化非线性系统识别方法

非线性系统非线性动力系统识别方法深度学习模型条件生成对抗网络

基于机器学习的婴幼儿哭声增强方法、装置及设备

站点导航

APP 下载