摘要
本发明涉及金融科技技术领域,公开了一种保险业务端的语音合成方法、装置、设备及介质,包括通过将目标文本嵌入特征与声学特征进行拼接融合得到目标拼接特征;将目标拼接特征输入到入预先训练好的语义特征处理模型的编码器中进行下采样操作后,得到目标语义特征;将目标语义特征输入到预先训练好的噪声滤除语音重构模型中,输出得到第一目标语音数据;将第一目标语音数据、目标语义特征和目标拼接特征,输入到预先训练好的语义特征处理模的解码器中得到目标语音。本方案解决了现有的保险业务端的文本到语音转换技术在处理复杂音韵或频繁切换的语音时,容易导致音质下降,从而导致客户在使用智能语音客服进行对话服务时体验度不好的问题。
技术关键词
语义特征
转换编码器
嵌入特征
声学特征
重构模型
文本
韵律特征
融合特征
噪声数据
注意力机制
智能语音客服
语音转换技术
金融科技技术
解码器
可读存储介质
音频
系统为您推荐了相关专利信息
指令解析方法
容错控制
时效性
控制类指令
语义特征
能耗数据分析方法
环保公厕
编码特征
解码矩阵
数据分析模型
自动识别方法
上下文语义理解
频谱特征
语音活动检测
声学特征