基于特定情感的语音转换方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202510293919

申请日期：2025-03-12

公开号：CN120126448A

公开日期：2025-06-10

类型：发明专利

摘要

本申请属于人工智能领域，可应用于医疗健康领域，涉及一种基于特定情感的语音转换方法，包括获取待转换文本，利用文本编码器提取所述待转换文本的内容特征；获取待转换风格，利用所述待转换风格从风格空间模块的风格空间中匹配出所述待转换风格的风格控制参数；将所述内容特征与所述风格控制参数，采用预定义的融合策略进行融合，得到融合信息；利用预先对抗性训练后的语音合成器对所述融合信息进行转换，得到所述待转换文本的目标语音波形。此外，本申请还涉及区块链技术，目标语音波形等可存储于区块链中。本申请能提高生成目标语音波形的准确率。

技术关键词

语音合成器转换文本语音转换方法风格文本编码器空间模块对抗性融合策略样本数据波形语音转换装置标签前馈神经网络计算机设备处理器医疗健康区块链技术

系统为您推荐了相关专利信息

一种生成大语言模型的推理语料的方法和计算设备

表达式生成自然语言大语言模型符号有向无环图

基于跨模态对齐的弱监督扒渣终点判断方法和系统

跨模态特征提取器视觉特征数据处理器终点判断方法

一种基于记忆管理的多轮对话方法、装置及电子设备

话题大语言模型多轮对话方法记忆管理电子设备

一种印花图案的仿刺绣风格生成方法

刺绣图像图像生成模型融合注意力机制代表风格

基于视觉模型的轨道交通环境异物侵入检测方法及系统

文本特征向量图像编码器图像特征向量异物侵入检测方法轨道交通环境

基于特定情感的语音转换方法、装置、设备及存储介质

站点导航

APP 下载