情感语音转换方法、装置、设备及介质

正文

推荐专利

情感语音转换方法、装置、设备及介质

申请号：CN202411500635

申请日期：2024-10-24

公开号：CN119380733B

公开日期：2025-11-28

类型：发明专利

摘要

本发明涉及人工智能技术领域，公开了一种情感语音转换方法、装置、设备及介质，方法包括：根据输入的原始音频波形转换提取原始音频特征表示，其中，原始音频特征表示为原始梅尔频谱图或SSL表示；根据输入的原始音频波形转换提取原始音频HuBERT表征作为真实单元序列；对提取获得的原始音频特征表示进行风格分解后结合目标风格进行风格重构，获得目标风格编码特征向量；通过交叉注意力机制根据情感单元输入的情感特征向量结合目标风格编码特征向量聚集上下文信息，并压缩至单元级；对上下文信息分别进行单元级风格化和帧级风格化；根据目标风格向量、单元级风格化后的上下文信息及帧级风格化后的上下文信息创建目标语音梅尔频谱图。

技术关键词

情感语音转换方法音频特征风格交叉注意力机制自动编码器波形语音转换装置序列长度调节器可读存储介质人工智能技术处理器重构模块矩阵

系统为您推荐了相关专利信息

建筑物功能分类方法及设备

功能分类方法活动特征 BERT模型序列特征视觉特征

基于稀疏-邻域联合约束的深度展开ISAR超分辨率成像方法

图像退化模型超分辨率成像阶段压缩感知理论分支

图像的生成方法、装置、设备、介质及产品

噪声图像像素生成图像特征阶段生成方法

一种基于功能行为的呼吸功能预测评估与康复系统

康复系统频域特征训练呼吸功能数据采集单元交叉注意力机制

基于多模态AIGC的服装设计系统系统、方法及其存储介质

服装设计系统特征提取模块风格结构特征提取语义

情感语音转换方法、装置、设备及介质

站点导航

APP 下载