一种音频修复方法、系统、介质和设备

正文

推荐专利

一种音频修复方法、系统、介质和设备

申请号：CN202511213289

申请日期：2025-08-28

公开号：CN120932663A

公开日期：2025-11-11

类型：发明专利

摘要

本申请提供一种音频修复方法、系统、介质和设备，包括：获取目标待处理音频；利用预训练多模态模型的文本编码器提取目标待处理音频对应的语义向量；通过跨模态适配层将语义向量映射至音频特征空间，生成目标声源的参考音频令牌；调用条件分离网络对齐混合音频与参考音频令牌，输出目标待处理音频的初步分离信号；定位初步分离信号的无效信号片段，将无效信号片段输入至设定生成式模型，输出得到高保真音频补丁；高保真音频补丁用于修复目标待处理音频。本申请能够精准地捕捉音频中的语义信息，通过参考音频令牌高效地对混合音频进行分析和分离，能够有效解决音频修复中的细节缺失问题，更好地填补无效信号片段。

技术关键词

音频修复方法语义向量文本编码器令牌多模态音频特征信号补丁跨模态网络短时傅里叶变换采样率可读存储介质存储计算机程序多层感知机修复系统信噪比

系统为您推荐了相关专利信息

文档图像篡改检测模型的训练方法、篡改检测方法和装置

图像篡改检测频域压缩感知多尺度感知网络篡改检测方法视觉

一种层次布局驱动的任意形状场景文本图像生成方法、系统、设备及介质

场景文本图像布局驱动字符训练集场景文本检测

一种面向高速公路的多模态事件理解方法和系统

面向高速公路文本语义实时图像数据

一种互联网医院用于预测辅助生殖技术程序结果的方法

辅助生殖技术时间序列预测模型长短期记忆网络互联网医院平台患者

一种基于多模态大模型和实例分割算法的道路病害智能识别评估方法

道路病害实例分割算法多模态协同优化方法深度学习方法

一种音频修复方法、系统、介质和设备

站点导航

APP 下载