摘要
本发明提供一种语音生成方法及装置、电子设备、介质、外呼系统,其中语音生成方法包括:获取待合成文本以及预设的语音信息;利用训练好的语音生成网络,基于编码器融合待合成文本以及语音信息,得到编码信息融合结果;利用训练好的语音生成网络,基于大模型整合编码信息融合结果,以生成语音并输出。该方法使用编码器整合待合成文本和语音信息,这一步可以将不同维度的信息进行融合,以将不同维度的信息整合到同一特征分布空间,提升准确性,从而提升后续语音合成的拟人程度;同时,采用大模型来进行语音合成,合成的语音拟人程度更高、更逼真;再结合实时生成技术,使得语音生成效率高、速度快。
技术关键词
语音生成方法
生成语音
文本
外呼系统
网络
编码器
生成装置
语音识别模块
分析模块
数据获取单元
电子设备
生成技术
存储器
处理器
可读存储介质
计算机
系统为您推荐了相关专利信息
容器网络配置方法
互联网协议IP地址
端口
节点
媒体访问控制MAC地址
网络抖动
网络分析
支持向量机模型
管理系统
节点
多尺度特征提取
低分辨率遥感图像
图像超分辨率技术
模块组合方式
全局结构信息