一种基于人工智能的音频数据处理方法、装置和计算机

正文

推荐专利

申请号：CN202510152179

申请日期：2025-02-12

公开号：CN119993206A

公开日期：2025-05-13

类型：发明专利

摘要

本申请涉及一种基于人工智能的音频数据处理方法、装置和计算机。所述方法包括：使用声纹特征提取得到对象的声纹数据，然后根据初始修复参数，结合对象的声纹和图像数据，对待处理声音中的语音变异和语义缺陷进行修复；如果修复后的声音数据仍存在语音变异或语义缺陷，则调整初始修复参数，并重新执行修复过程；这个调整和修复的过程会不断迭代，直到检测到声音数据不再存在语音变异和语义缺陷为止；当无法再检测到问题时，修复后的声音数据将作为目标声音数据输出。采用本方法能够有效提高在对存在语音变异和语义缺陷的音频数据的实时修复效率。

技术关键词

对象图像数据语义隔离声音数据声纹特征语音音频数据处理方法参数场景特征情景音频数据处理装置发音特征提取模块数据获取模块策略计算机合规性

系统为您推荐了相关专利信息

任务响应策略生成方法、装置、设备、存储介质及程序产品

生物识别信息指令数据策略生成方法指示机器人

一种基于局部像素关系和人脸-背景多比例分支的深度伪造视频检测方法

伪造视频检测方法像素分支融合策略关系

一种面向用户指定任务的命令驱动语义化机器人抓取方法和系统

化机器人视觉特征抓取方法实例分割注意力机制

一种改进的水下图像增强方法

水下图像增强方法通道卷积模块输出特征融合特征

一种基于深度学习的非接触式轮胎形变智能识别方法

智能识别方法轮胎橡胶像素接触式轮廓

一种基于人工智能的音频数据处理方法、装置和计算机

站点导航

APP 下载