摘要
本申请提供一种显示设备、服务器及语音合成方法。所述显示设备在接收到用户输入的语音交互指令时,调用语言提取模型提取样本文本中的逐字向量和整句向量。语言提取模型为根据样本文本训练得到的模型,且样本文本中设置有特征标签。通过特征标签可以在训练模型的过程中使模型具有识别口语化特征的能力,进而在合成语音中增加口语化特征,提高合成语音的拟人度。根据样本文本和样本文本的音频还可以提取语速标签向量和音素向量。将逐字向量、整句向量、语速标签向量和音素向量共同输入至解码器可以得到目标合成语音,并由音频输出装置播放目标合成语音。
技术关键词
标签
显示设备
样本
文本
语音
音频输出装置
解码器
序列
正态分布曲线
关键字
情感特征
控制器
信息提取模型
语义特征
服务器
建立通信
通信单元
指令
控制单元
系统为您推荐了相关专利信息
通道注意力机制
检测模型训练方法
网络
三元组
锚点
配电智能终端
状态监测方法
矩阵
网络带宽利用率
多模态特征
低代码平台
页面搭建方法
抽象语法树
多模态特征
视觉特征
大型工程装备
随机森林模型
推荐方法
超参数
知识图谱数据