复合风格语音的生成方法、装置、设备及存储介质

AITNT
正文
推荐专利
复合风格语音的生成方法、装置、设备及存储介质
申请号:CN202510046980
申请日期:2025-01-08
公开号:CN119889285B
公开日期:2025-11-28
类型:发明专利
摘要
本申请属于人工智能领域及医疗健康领域,涉及一种复合风格语音的生成方法,包括获取文本序列,利用文本编码器对文本序列进行特征提取,得到文本语义信息,其中文本语义信息包括语义特征向量和韵律特征向量;通过风格专家模块的每个风格专家网络对文本语义信息进行风格转换,得到多个风格语音特征;获取目标风格条件,通过门控网络对文本语义信息和目标风格条件进行处理,得到风格权重,根据风格权重对多个风格语音特征进行加权求和操作,得到复合风格特征;通过语音合成器对复合风格特征进行转换,得到文本序列的复合风格语音。此外,本申请还涉及区块链技术,目标页面等可存储于区块链中。本申请能提高复合风格语音的流畅性。
技术关键词
风格 语音特征 语音合成器 语义 文本编码器 生成方法 序列 网络 标签 模块 计算机设备 韵律预测 医疗健康 区块链技术 训练集 处理器通信
系统为您推荐了相关专利信息
1
基于语义编码的多模态大模型云边协同推理方法、装置、设备及介质
多模态 语义 样本 推理方法 云端服务器
2
一种基于知识图谱的水土保持方法和系统
文本 标签 图谱 水土保持方法 水土保持系统
3
键值对路径生成方法、装置、电子设备和计算机可读介质
键值 结构异常检测 模板 路径生成方法 语义
4
基于多维度特征融合的异常短信行为检测方法及系统
时空分布特征 短信 验证机制 场景特征 级联式
5
基于语义与几何引导的多阶段Mamba点云补全方法及装置
排序策略 骨架点云 状态空间方程 校准 解码器单元
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号