摘要
本申请属于人工智能技术领域,适用于金融或医疗领域,涉及一种合成语音生成方法、装置、计算机设备及存储介质,该方法包括:获取用户终端发送的合成语音生成请求,其中,所述合成语音生成请求包括待合成文本数据、待合成语音数据以及文本标记位置数据;将所述待合成文本数据输入至XLM编码器进行文本编码操作,得到XLM标记嵌入数据;对所述待合成语音数据进行下采样操作,得到下采样注册标记数据;将所述文本标记位置数据输入至位置编码器进行位置编码操作,得到标记位置嵌入数据;将所述XLM标记嵌入数据、所述下采样注册标记数据以及所述标记位置嵌入数据输入至音频Transformer模型进行音频预测操作,得到音频预测数据。本申请可以有效减少对标注数据的依赖。
技术关键词
语音生成方法
数据
标记
计算机可读指令
文本
语音编码
位置编码器
音频采样
计算机设备
解码器
采样模块
编码模块
生成装置
可读存储介质
音频解码
人工智能技术
系统为您推荐了相关专利信息
产品推荐方法
标签
计算机执行指令
数据获取模块
产品推荐装置
特征污染物
数据插补方法
数据缺失值
双向长短期记忆
水质
浓度调节方法
深度神经网络
补气阀门
历史运行数据
位置编码单元
深度设计方法
三维地质模型
分块
边坡
优化约束条件
动态路径规划
北斗技术
无人机
北斗卫星导航接收机
卫星导航解算