摘要
本申请实施例提出的语音合成方法、语音合成装置、电子设备及存储介质,涉及人工智能技术领域及金融科技领域。该方法包括:通过内容编码教师模型和初始内容编码学生模型分别对掩码声学特征表示序列进行内容编码,得到第一内容向量和第二内容向量;根据第一内容向量和第二内容向量计算得到目标损失数据;根据目标损失数据对初始内容编码学生模型进行参数调整,得到目标内容编码学生模型;通过目标内容编码学生模型对目标语音数据进行内容编码,得到目标内容向量;根据目标内容向量、目标说话人向量以及目标韵律向量进行解码,得到目标合成语音数据。本申请实施例能够保证语音合成的内容准确性和情感,还提高了语音合成效率。
技术关键词
声学特征
语音
学生
样本
序列
教师
电子设备
编码模块
重构
说话人识别
可读存储介质
解码
人工智能技术
参数
注意力
蒸馏
数据更新
处理器
系统为您推荐了相关专利信息
加热不燃烧器具
标志位
温度控制方法
模式
语音识别模块
智能决策引擎
模态特征
多模态
健康风险评估
语义
智能监管系统
电子台账
NFC芯片
加密
集成压力传感器