摘要
本申请属于人工智能领域,可应用于医疗健康领域,涉及一种基于特定情感的语音转换方法,包括获取待转换文本,利用文本编码器提取所述待转换文本的内容特征;获取待转换风格,利用所述待转换风格从风格空间模块的风格空间中匹配出所述待转换风格的风格控制参数;将所述内容特征与所述风格控制参数,采用预定义的融合策略进行融合,得到融合信息;利用预先对抗性训练后的语音合成器对所述融合信息进行转换,得到所述待转换文本的目标语音波形。此外,本申请还涉及区块链技术,目标语音波形等可存储于区块链中。本申请能提高生成目标语音波形的准确率。
技术关键词
语音合成器
转换文本
语音转换方法
风格
文本编码器
空间模块
对抗性
融合策略
样本
数据
波形
语音转换装置
标签
前馈神经网络
计算机设备
处理器
医疗健康
区块链技术
系统为您推荐了相关专利信息
表达式
生成自然语言
大语言模型
符号
有向无环图
跨模态
特征提取器
视觉特征
数据处理器
终点判断方法
话题
大语言模型
多轮对话方法
记忆管理
电子设备
刺绣图像
图像生成模型
融合注意力机制
代表
风格
文本特征向量
图像编码器
图像特征向量
异物侵入检测方法
轨道交通环境