一种语音环境转换方法及系统

正文

推荐专利

一种语音环境转换方法及系统

申请号：CN202411936201

申请日期：2024-12-26

公开号：CN119864007A

公开日期：2025-04-22

类型：发明专利

摘要

本发明公开一种语音环境转换方法及系统，属于语音环境转换领域；一种语音环境转换方法包括：获取原音频和目标音频；通过FVQ模型，从将原音频和目标音频中提取音色特征向量、语义词元和音频环境词元；语义词元对音频环境词元执行交叉注意力后，与音色特征向量一起送入解码器中，最终得到合成音频。实现对音频环境及音频内容，音色的解耦，从而实现语音环境的转换、音频环境效果强度的控制以及多个音频环境叠加的功能。

技术关键词

音频转换方法语音矢量量化语义环境转换系统解码器注意力编码器主体分类器通信接口计算机存储介质计算机程序产品存储器处理器指令数据电子设备

系统为您推荐了相关专利信息

一种基于知识图谱的质量问题智能推理方法及系统

智能推理方法节点路径匹配智能推理系统知识推理技术

用于音频记录的无标记集合中的异常检测的系统和方法

音频样本训练机器学习模型集群数据

一种水下目标检测方法及系统

检测头融合特征语义特征融合注意力机制残差矩阵

一种基于智能体工作流的自动客服方法

客服方法饱和度词汇数据库语句自动客服技术

一种水迹检测方法、系统、设备及存储介质

巡检图像分类网络处理器计算机存储介质图像处理技术

一种语音环境转换方法及系统

站点导航

APP 下载