一种语音环境转换方法及系统

AITNT
正文
推荐专利
一种语音环境转换方法及系统
申请号:CN202411936201
申请日期:2024-12-26
公开号:CN119864007A
公开日期:2025-04-22
类型:发明专利
摘要
本发明公开一种语音环境转换方法及系统,属于语音环境转换领域;一种语音环境转换方法包括:获取原音频和目标音频;通过FVQ模型,从将原音频和目标音频中提取音色特征向量、语义词元和音频环境词元;语义词元对音频环境词元执行交叉注意力后,与音色特征向量一起送入解码器中,最终得到合成音频。实现对音频环境及音频内容,音色的解耦,从而实现语音环境的转换、音频环境效果强度的控制以及多个音频环境叠加的功能。
技术关键词
音频 转换方法 语音 矢量量化 语义 环境转换系统 解码器 注意力 编码器主体 分类器 通信接口 计算机存储介质 计算机程序产品 存储器 处理器 指令 数据 电子设备
系统为您推荐了相关专利信息
1
一种基于知识图谱的质量问题智能推理方法及系统
智能推理方法 节点 路径匹配 智能推理系统 知识推理技术
2
用于音频记录的无标记集合中的异常检测的系统和方法
音频 样本 训练机器学习模型 集群 数据
3
一种水下目标检测方法及系统
检测头 融合特征 语义特征 融合注意力机制 残差矩阵
4
一种基于智能体工作流的自动客服方法
客服方法 饱和度 词汇数据库 语句 自动客服技术
5
一种水迹检测方法、系统、设备及存储介质
巡检图像 分类网络 处理器 计算机存储介质 图像处理技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号