一种语音生成方法及装置、电子设备、介质、外呼系统

正文

推荐专利

申请号：CN202411959889

申请日期：2024-12-30

公开号：CN119811355A

公开日期：2025-04-11

类型：发明专利

摘要

本发明提供一种语音生成方法及装置、电子设备、介质、外呼系统，其中语音生成方法包括：获取待合成文本以及预设的语音信息；利用训练好的语音生成网络，基于编码器融合待合成文本以及语音信息，得到编码信息融合结果；利用训练好的语音生成网络，基于大模型整合编码信息融合结果，以生成语音并输出。该方法使用编码器整合待合成文本和语音信息，这一步可以将不同维度的信息进行融合，以将不同维度的信息整合到同一特征分布空间，提升准确性，从而提升后续语音合成的拟人程度；同时，采用大模型来进行语音合成，合成的语音拟人程度更高、更逼真；再结合实时生成技术，使得语音生成效率高、速度快。

技术关键词

语音生成方法生成语音文本外呼系统网络编码器生成装置语音识别模块分析模块数据获取单元电子设备生成技术存储器处理器可读存储介质计算机

系统为您推荐了相关专利信息

基于图文信息和大语言模型的工程图纸审核方法及系统

工程图纸审核文本图文大语言模型滑动窗口

容器网络配置方法、装置、设备及存储介质

容器网络配置方法互联网协议IP地址端口节点媒体访问控制MAC地址

一种基于网络分析的5G视频通话质量管理系统

网络抖动网络分析支持向量机模型管理系统节点

一种基于自适应进化卷积自编码器的遥感图像超分辨率重建方法

多尺度特征提取低分辨率遥感图像图像超分辨率技术模块组合方式全局结构信息

基于多模态的中文情感分类方法、装置及电子设备

中文文本中文情感分类方法矩阵图像注意力

一种语音生成方法及装置、电子设备、介质、外呼系统

站点导航

APP 下载