摘要
本申请属于人工智能领域,可应用于医疗健康领域,涉及一种基于特定情感的语音转换方法,包括获取待转换文本,利用文本编码器提取所述待转换文本的内容特征;获取待转换风格,利用所述待转换风格从风格空间模块的风格空间中匹配出所述待转换风格的风格控制参数;将所述内容特征与所述风格控制参数,采用预定义的融合策略进行融合,得到融合信息;利用预先对抗性训练后的语音合成器对所述融合信息进行转换,得到所述待转换文本的目标语音波形。此外,本申请还涉及区块链技术,目标语音波形等可存储于区块链中。本申请能提高生成目标语音波形的准确率。
技术关键词
语音合成器
转换文本
语音转换方法
风格
文本编码器
空间模块
对抗性
融合策略
样本
数据
波形
语音转换装置
标签
前馈神经网络
计算机设备
处理器
医疗健康
区块链技术
系统为您推荐了相关专利信息
预训练模型
三元组损失函数
识别方法
细粒度特征
图像特征向量
图片检索方法
三元组损失函数
多模态特征融合
文本编码器
图像编码器
融合人脸识别
分析单元
多头注意力机制
风格
生成个性化推荐
视频帧
意图识别模型
非易失性存储介质
分支
数据