摘要
本申请涉及一种基于人工智能的音频数据处理方法、装置和计算机。所述方法包括:使用声纹特征提取得到对象的声纹数据,然后根据初始修复参数,结合对象的声纹和图像数据,对待处理声音中的语音变异和语义缺陷进行修复;如果修复后的声音数据仍存在语音变异或语义缺陷,则调整初始修复参数,并重新执行修复过程;这个调整和修复的过程会不断迭代,直到检测到声音数据不再存在语音变异和语义缺陷为止;当无法再检测到问题时,修复后的声音数据将作为目标声音数据输出。采用本方法能够有效提高在对存在语音变异和语义缺陷的音频数据的实时修复效率。
技术关键词
对象图像数据
语义
隔离声音数据
声纹特征
语音
音频数据处理方法
参数
场景特征
情景
音频数据处理装置
发音
特征提取模块
数据获取模块
策略
计算机
合规性
系统为您推荐了相关专利信息
生物识别信息
指令
数据
策略生成方法
指示机器人
化机器人
视觉特征
抓取方法
实例分割
注意力机制
水下图像增强方法
通道
卷积模块
输出特征
融合特征