音频处理方法、装置、非易失性存储介质及电子设备

AITNT
正文
推荐专利
音频处理方法、装置、非易失性存储介质及电子设备
申请号:CN202511088514
申请日期:2025-08-04
公开号:CN120932659A
公开日期:2025-11-11
类型:发明专利
摘要
本申请公开了一种音频处理方法、装置、非易失性存储介质及电子设备。其中,该方法包括:确定目标发声对象的第一声音特征,以及待处理音频的第一语义信息,其中,待处理音频为目标发声对象发出的音频;确定待处理音频的待处理音频特征图,其中,待处理音频特征图用于体现待处理音频的音频特征;拼接第一声音特征,第一语义信息和音频特征图,得到第一拼接结果;采用音频处理模型处理第一拼接结果,得到与待处理音频对应的目标音频,其中,音频处理模型包括扩散模型。本申请解决了由于相关技术中采用人工调节的方式对音频进行美化处理导致的成本高且效率低的技术问题。
技术关键词
音频特征 非易失性存储介质 语义 发声 随机噪声 掩膜 数据 噪声特征 对象 电子设备 计算机程序产品 处理器 模块 存储器 矩阵 时间段
系统为您推荐了相关专利信息
1
基于智能图像识别的门禁管理方法及系统
智能图像识别 门禁管理方法 身份验证 决策 数据
2
一种企业画像生成方法、装置、电子设备及存储介质
企业画像生成方法 企业知识库 校验规则 语义 基础
3
基于语音意图识别的用户分类系统
语音意图识别 融合语义 分类系统 文本 语音采集模块
4
一种基于用户反馈的短信内容AI迭代方法及系统
迭代方法 短信 主题 序列 多轮对话
5
一种基于Informer的长序列知识追踪方法
知识追踪方法 答题 时间卷积网络 序列 知识点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号