一种基于深度学习的语音增强方法、装置、设备及介质

AITNT
正文
推荐专利
一种基于深度学习的语音增强方法、装置、设备及介质
申请号:CN202411933754
申请日期:2024-12-26
公开号:CN119811414A
公开日期:2025-04-11
类型:发明专利
摘要
本发明涉及语音识别技术领域,公开了一种基于深度学习的语音增强方法、装置、设备及介质。该方法包括:获取带噪语音信号,通过一维卷积对带噪语音信号进行特征提取,得到带噪语音特征;将带噪语音特征输入掩膜预测模型,得到比值掩膜,根据比值掩膜计算预测纯净语音特征;将预测纯净语音特征输入全连接层,得到预测纯净语音信号;获取实际纯净语音信号,根据实际纯净语音信号与预测纯净语音信号,训练一维卷积、掩膜预测模型与全连接层,得到训练后的一维卷积、训练后的掩膜预测模型与训练后的全连接层。本申请可以适应不同采样率的语音增强,避免了人为特征提取难以兼容不同采样率的问题。
技术关键词
带噪语音信号 语音特征 掩膜 语音识别技术 采样率 可读存储介质 误差 传播算法 处理器 网络结构 计算机设备 模块 存储器 信噪比 指标 元素
系统为您推荐了相关专利信息
1
一种高亮Micro-LED芯片及其制作方法
半导体层 接触电极 高温淬火工艺 控制表面粗糙度 蓝宝石衬底
2
一种基于低采样率信号云端智能重构的液压泵远程状态监测方法及系统
远程状态监测方法 采样率 液压泵 深层特征提取 状态监测数据
3
一种基于人工智能的数字人平台交互系统及方法
答案 面部特征 数字孪生技术 交互方法 交互系统
4
一种语音生成方法及装置
语音生成方法 语音特征参数 语音生成模型 文本 样本
5
一种基于深度语音嵌入的声纹识别方法及系统
声纹识别方法 高维特征向量 深度学习网络模型 预训练模型 大规模语音数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号