基于机器学习的婴幼儿哭声增强方法、装置及设备

AITNT
正文
推荐专利
基于机器学习的婴幼儿哭声增强方法、装置及设备
申请号:CN202411080693
申请日期:2024-08-08
公开号:CN118609605B
公开日期:2024-10-18
类型:发明专利
摘要
本发明涉及音频处理技术领域,解决了现有技术中收集到的婴幼儿哭声受限于杂音的干扰,难以准确区分和提取出有效婴幼儿哭声的问题,提供了一种基于机器学习的婴幼儿哭声增强方法、装置及设备。该方法包括:获取第一音频数据,其中,所述第一音频数据包括至少一段含有婴幼儿哭声的音频数据;对所述第一音频数据进行预处理,得到第一音频数据对应的频谱图;将所述频谱图输入自编码器模型,输出所述第一音频数据中与婴幼儿哭声对应的音频特征信息;根据所述音频特征信息,对含有婴幼儿哭声的音频数据进行处理,得到增强后的第二音频数据。本发明有效地从嘈杂环境中提取并增强了婴幼儿哭声,显著提高了哭声信号的纯净度和识别率。
技术关键词
音频特征信息 编码器 计算机程序指令 时域音频信号 传播算法 正则化参数 重构 分段 采样率 特征提取模块 数据获取模块 表达式 处理器 存储器 矩阵 电子设备
系统为您推荐了相关专利信息
1
一种基于K均值算法的风类识别方法、介质及设备
K均值算法 数据 K均值聚类算法 风量传感器 识别方法
2
车门控制方法、装置、设备和存储介质
滑动窗口 传感器 深度学习模型 车门控制方法 信号强度阈值
3
基于图像序列和Transformer网络的工业设备指示灯状态识别方法
图像编码器 工业设备 序列 图像特征关系 神经网络模型
4
一种基于深度Q网络的多通道干扰系统自适应任务调度方法
任务调度方法 深度Q网络 多通道 方位角 执行效能
5
一种用于解决概念漂移现象的哈希检索方法
深度哈希网络 训练集 哈希检索方法 编码 教师
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号