一种基于人工智能的音频数据处理方法、装置和计算机

AITNT
正文
推荐专利
一种基于人工智能的音频数据处理方法、装置和计算机
申请号:CN202510152179
申请日期:2025-02-12
公开号:CN119993206A
公开日期:2025-05-13
类型:发明专利
摘要
本申请涉及一种基于人工智能的音频数据处理方法、装置和计算机。所述方法包括:使用声纹特征提取得到对象的声纹数据,然后根据初始修复参数,结合对象的声纹和图像数据,对待处理声音中的语音变异和语义缺陷进行修复;如果修复后的声音数据仍存在语音变异或语义缺陷,则调整初始修复参数,并重新执行修复过程;这个调整和修复的过程会不断迭代,直到检测到声音数据不再存在语音变异和语义缺陷为止;当无法再检测到问题时,修复后的声音数据将作为目标声音数据输出。采用本方法能够有效提高在对存在语音变异和语义缺陷的音频数据的实时修复效率。
技术关键词
对象图像数据 语义 隔离声音数据 声纹特征 语音 音频数据处理方法 参数 场景特征 情景 音频数据处理装置 发音 特征提取模块 数据获取模块 策略 计算机 合规性
系统为您推荐了相关专利信息
1
任务响应策略生成方法、装置、设备、存储介质及程序产品
生物识别信息 指令 数据 策略生成方法 指示机器人
2
一种基于局部像素关系和人脸-背景多比例分支的深度伪造视频检测方法
伪造视频检测方法 像素 分支 融合策略 关系
3
一种面向用户指定任务的命令驱动语义化机器人抓取方法和系统
化机器人 视觉特征 抓取方法 实例分割 注意力机制
4
一种改进的水下图像增强方法
水下图像增强方法 通道 卷积模块 输出特征 融合特征
5
一种基于深度学习的非接触式轮胎形变智能识别方法
智能识别方法 轮胎橡胶 像素 接触式 轮廓
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号