基于机器学习的婴幼儿哭声增强方法、装置及设备

AITNT
正文
推荐专利
基于机器学习的婴幼儿哭声增强方法、装置及设备
申请号:CN202411080693
申请日期:2024-08-08
公开号:CN118609605B
公开日期:2024-10-18
类型:发明专利
摘要
本发明涉及音频处理技术领域,解决了现有技术中收集到的婴幼儿哭声受限于杂音的干扰,难以准确区分和提取出有效婴幼儿哭声的问题,提供了一种基于机器学习的婴幼儿哭声增强方法、装置及设备。该方法包括:获取第一音频数据,其中,所述第一音频数据包括至少一段含有婴幼儿哭声的音频数据;对所述第一音频数据进行预处理,得到第一音频数据对应的频谱图;将所述频谱图输入自编码器模型,输出所述第一音频数据中与婴幼儿哭声对应的音频特征信息;根据所述音频特征信息,对含有婴幼儿哭声的音频数据进行处理,得到增强后的第二音频数据。本发明有效地从嘈杂环境中提取并增强了婴幼儿哭声,显著提高了哭声信号的纯净度和识别率。
技术关键词
音频特征信息 编码器 计算机程序指令 时域音频信号 传播算法 正则化参数 重构 分段 采样率 特征提取模块 数据获取模块 表达式 处理器 存储器 矩阵 电子设备
系统为您推荐了相关专利信息
1
基于GIS的地理信息获取方法及系统
地理信息获取方法 波动特征 地理信息获取系统 气象 滤波算法
2
一种电力金具遮挡图像识别方法及系统
电力金具 图像识别方法 卷积解码器 卷积编码器 图像采集设备
3
多码道绝对式编码器位置检测方法
位置检测方法 编码器 单周期 细分方法 周期性
4
基于掩码先验的两阶段红外与可见光图像融合方法
可见光图像 融合方法 编码器模块 融合策略 解码器
5
一种基于动力学嵌入GAN的参数化非线性系统识别方法
非线性系统 非线性动力系统 识别方法 深度学习模型 条件生成对抗网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号