复合风格语音的生成方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202510046980

申请日期：2025-01-08

公开号：CN119889285B

公开日期：2025-11-28

类型：发明专利

摘要

本申请属于人工智能领域及医疗健康领域，涉及一种复合风格语音的生成方法，包括获取文本序列，利用文本编码器对文本序列进行特征提取，得到文本语义信息，其中文本语义信息包括语义特征向量和韵律特征向量；通过风格专家模块的每个风格专家网络对文本语义信息进行风格转换，得到多个风格语音特征；获取目标风格条件，通过门控网络对文本语义信息和目标风格条件进行处理，得到风格权重，根据风格权重对多个风格语音特征进行加权求和操作，得到复合风格特征；通过语音合成器对复合风格特征进行转换，得到文本序列的复合风格语音。此外，本申请还涉及区块链技术，目标页面等可存储于区块链中。本申请能提高复合风格语音的流畅性。

技术关键词

风格语音特征语音合成器语义文本编码器生成方法序列网络标签模块计算机设备韵律预测医疗健康区块链技术训练集处理器通信

系统为您推荐了相关专利信息

基于语义编码的多模态大模型云边协同推理方法、装置、设备及介质

多模态语义样本推理方法云端服务器

一种基于知识图谱的水土保持方法和系统

文本标签图谱水土保持方法水土保持系统

键值对路径生成方法、装置、电子设备和计算机可读介质

键值结构异常检测模板路径生成方法语义

基于多维度特征融合的异常短信行为检测方法及系统

时空分布特征短信验证机制场景特征级联式

基于语义与几何引导的多阶段Mamba点云补全方法及装置

排序策略骨架点云状态空间方程校准解码器单元

复合风格语音的生成方法、装置、设备及存储介质

站点导航

APP 下载