基于机器学习的婴幼儿哭声增强方法、装置及设备

AITNT
正文
推荐专利
基于机器学习的婴幼儿哭声增强方法、装置及设备
申请号:CN202411080693
申请日期:2024-08-08
公开号:CN118609605B
公开日期:2024-10-18
类型:发明专利
摘要
本发明涉及音频处理技术领域,解决了现有技术中收集到的婴幼儿哭声受限于杂音的干扰,难以准确区分和提取出有效婴幼儿哭声的问题,提供了一种基于机器学习的婴幼儿哭声增强方法、装置及设备。该方法包括:获取第一音频数据,其中,所述第一音频数据包括至少一段含有婴幼儿哭声的音频数据;对所述第一音频数据进行预处理,得到第一音频数据对应的频谱图;将所述频谱图输入自编码器模型,输出所述第一音频数据中与婴幼儿哭声对应的音频特征信息;根据所述音频特征信息,对含有婴幼儿哭声的音频数据进行处理,得到增强后的第二音频数据。本发明有效地从嘈杂环境中提取并增强了婴幼儿哭声,显著提高了哭声信号的纯净度和识别率。
技术关键词
音频特征信息 编码器 计算机程序指令 时域音频信号 传播算法 正则化参数 重构 分段 采样率 特征提取模块 数据获取模块 表达式 处理器 存储器 矩阵 电子设备
系统为您推荐了相关专利信息
1
一种基于智能床垫的身体区域划分方法及设备
掩码矩阵 区域划分方法 身体 压力 元素
2
智能通信重传方法、装置、电子设备及存储介质
重传方法 数据 信号 信道 发送端
3
基于大语言模型微调的漏洞检测方法
漏洞检测方法 大语言模型 前馈神经网络 注意力机制 矩阵
4
面向分钟级的雷暴大风临近预报方法及系统
临近预报方法 气象观测数据 雷达回波数据 地面自动气象站 闪电定位数据
5
一种基于感兴趣区域的VVC自适应视频编码方法及系统
视频编码方法 生成可视化界面 感兴趣 显著性检测算法 运动检测算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号