音频的修音方法、装置、设备、介质、产品

AITNT
正文
推荐专利
音频的修音方法、装置、设备、介质、产品
申请号:CN202510882326
申请日期:2025-06-27
公开号:CN120656435A
公开日期:2025-09-16
类型:发明专利
摘要
本申请公开了一种音频的修音方法、装置、设备、介质、产品,包括如下步骤:获取第一账号针对第一多媒体作品的人声音频,人声音频中包括至少两个音频分段;获取至少两个音频分段分别对应的音频质量;从至少两个音频分段中获取音频质量符合预设质量要求的至少一个目标音频分段,基于目标音频分段生成第一账号对应的音色特征向量;基于音色特征向量获取修音音频,修音音频是基于音色特征向量和第一多媒体作品的引导数据对人声音频修音后得到的音频,引导数据与第一多媒体作品的音频特征相关。能够提高生成修音音频时的效率。
技术关键词
分段 多媒体 音频特征提取 账号 人声 机器学习模型 数据 编码器 特征音色 计算机设备 音色特征 波形 计算机程序产品 处理器 网络 标签 可读存储介质
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号