基于频带分割的声码器音频生成方法、装置、设备及介质

AITNT
正文
推荐专利
基于频带分割的声码器音频生成方法、装置、设备及介质
申请号:CN202411387285
申请日期:2024-09-30
公开号:CN119207462B
公开日期:2025-11-18
类型:发明专利
摘要
本发明涉及人工智能技术领域和金融科技领域,公开了一种基于频带分割的声码器音频生成方法,通过将输入的音频信号转换为Log梅尔频谱,通过一维卷积网络对频谱信号进行初步处理。信号经过转置卷积进行上采样处理后,利用多感受野模块对不同频带的特征进行提取与处理。在频带分割过程中,信号在通道维度上被分割为多个张量,每个张量对应特定的频带范围,分别进行独立处理。使用PQMF合成滤波器组对已统一通道数的信号再次进行上采样。在信号合并后,通过另一多感受野模块处理最终生成的音频信号。本发明通过频带分割和独立的多感受野模块处理不同频带的张量,减少了转置卷积在上采样过程中引入的频率混叠现象,从而提高了音频生成的质量和自然性。
技术关键词
音频生成方法 上采样 生成程序 多尺度特征提取 非线性 信号处理 频率 网络模块 生成装置 计算机设备 滤波器 混叠现象 人工智能技术 多通道 处理器
系统为您推荐了相关专利信息
1
印刷电路板的缺陷检测方法及电子设备
图像 策略 上采样 电路板 缺陷检测方法
2
一种PVC塑料瓦生产用原料自动上料控制系统
原料自动上料控制系统 中央控制单元 PID控制算法 PVC塑料瓦 电控阀门
3
基于多源数据融合的飞行器气动特性智能重构方法
飞行器气动特性 智能重构方法 权重模型 气动力特性研究 数据
4
一种薄膜厚度在线测量方法
厚度在线测量方法 卷积神经网络模型 薄膜 光纤探头 卤钨灯光源
5
一种基于剩磁预测的变压器励磁涌流抑制方法
剩磁预测 抑制算法 电流 变压器励磁涌流 变压器控制技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号