适用于复杂环境下的音频数据增强方法及系统

AITNT
正文
推荐专利
适用于复杂环境下的音频数据增强方法及系统
申请号:CN202411918642
申请日期:2024-12-25
公开号:CN119360876B
公开日期:2025-02-28
类型:发明专利
摘要
本申请涉及音频数据处理技术领域,具体涉及适用于复杂环境下的音频数据增强方法及系统,该方法包括:获取音频数据在各时间帧的音频数据序列和频谱序列;基于音频数据序列的幅值的离散程度获取语音密集时间帧;计算各时间帧的语音估计强度;将各时间帧的频谱序列等间隔划分为预设个数的频谱子序列;计算各时间帧的频谱序列的各频谱子序列的频段干扰评估值;获取各时间帧的频谱序列中各频谱子序列的残余噪声能量阈值,对音频数据进行增强。本申请提高了对复杂环境下音频数据的增强效果。
技术关键词
序列 语音 音频数据处理技术 频段 噪声 功率 阈值分割算法 幅值 强度 处理器 存储器 因子
系统为您推荐了相关专利信息
1
一种基于本地小批量梯度差分隐私的联邦学习方法
联邦学习方法 差分隐私 客户端 梯度下降算法 服务器
2
基于扩散模型的多任务视觉基础模型图像生成方法
多任务 图像生成方法 卷积模块 视觉 适配器
3
一种基于双分解和混合模型的水质预测方法及相关装置
水质预测方法 LSTM模型 皮尔逊相关系数 集合经验模态分解 数据
4
基于三波长激光双探测器多角度异面检测装置及方法
多角度 光电探测器 散射光 波长 激光发射单元
5
长文本的延迟分块嵌入处理方法、装置及存储介质
分块策略 序列 滑动窗口 非暂态计算机可读存储介质 语义向量
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号