摘要
本申请公开了一种基于倒谱和深度学习的骨导语音增强方法、装置、存储介质及设备,属于蓝牙音频编解码技术领域,该方法包括:输入PCM音频数据,并执行低延迟改进型离散余弦变换,输出骨导语音谱系数;根据骨导语音谱系数,通过结合倒谱和深度学习得到增强的骨导语音谱系数;以及根据增强的骨导语音谱系数,继续执行标准LC3编码过程,输出增强的语音码流。本申请通过结合倒谱和深度学习,在对骨导语音进行LC3编码的同时增强了音质,提高了用户体验,而且复用了编码和深度学习的特征提取步骤,节省了存储空间和算力需求。
技术关键词
语音
低延迟
音频编解码技术
深度学习模型
离散余弦
编码
网络
时域噪声
噪声整形
噪声电平
指令
计算机设备
可读存储介质
存储器
处理器
模块
数据
系统为您推荐了相关专利信息
硬盘热插拔
测试管理平台
管理服务器
工控机
控制机械手
模糊逻辑
无人驾驶车辆
隶属度函数
历史交通数据
风险
声纹识别模型
设备工作状态
音频波形数据
识别方法
声纹特征
策略优化模型
管理优化方法
数据
点击率
深度学习模型