音频处理方法、装置、非易失性存储介质及电子设备

AITNT
正文
推荐专利
音频处理方法、装置、非易失性存储介质及电子设备
申请号:CN202511088514
申请日期:2025-08-04
公开号:CN120932659A
公开日期:2025-11-11
类型:发明专利
摘要
本申请公开了一种音频处理方法、装置、非易失性存储介质及电子设备。其中,该方法包括:确定目标发声对象的第一声音特征,以及待处理音频的第一语义信息,其中,待处理音频为目标发声对象发出的音频;确定待处理音频的待处理音频特征图,其中,待处理音频特征图用于体现待处理音频的音频特征;拼接第一声音特征,第一语义信息和音频特征图,得到第一拼接结果;采用音频处理模型处理第一拼接结果,得到与待处理音频对应的目标音频,其中,音频处理模型包括扩散模型。本申请解决了由于相关技术中采用人工调节的方式对音频进行美化处理导致的成本高且效率低的技术问题。
技术关键词
音频特征 非易失性存储介质 语义 发声 随机噪声 掩膜 数据 噪声特征 对象 电子设备 计算机程序产品 处理器 模块 存储器 矩阵 时间段
系统为您推荐了相关专利信息
1
一种代码混淆方法、装置、设备及存储介质
代码混淆方法 代码混淆装置 神经网络模型训练 结构特征提取 识别模型训练
2
视频生成方法、装置、电子设备、介质及程序产品
音频特征 视频生成方法 图像 计算机程序指令 语义特征提取
3
基于鲁棒自编码器的C3级列控系统网络恶意流量检测方法
控系统网络 恶意流量检测方法 正则化极限学习机 恶意流量检测模型 粒子群算法优化
4
基于通用知识嵌入对比学习的高光谱图像分类方法及系统
光谱图像分类方法 半监督学习模型 线性 高光谱遥感图像 编码器模块
5
基于物联网的急诊监护室内目标识别方法及系统
急诊监护室 语义协同 识别方法 视频流 3DCNN模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号