一种语音合成方法、装置、设备及介质

正文

推荐专利

一种语音合成方法、装置、设备及介质

申请号：CN202411543187

申请日期：2024-10-30

公开号：CN119296511A

公开日期：2025-01-10

类型：发明专利

摘要

本申请属于人工智能领域，涉及一种语音合成方法，包括：获取待合成语音的文本与表征目标情感的参考音频；采用情感编码模型，对参考音频进行特征提取，构建描述目标情感的目标三维情感坐标；对目标三维情感坐标进行坐标转换处理，得到描述目标情感的目标球面情感坐标；采用情感编码器，对目标球面情感坐标进行编码转换，得到描述目标情感的目标情感嵌入向量；采用语音合成模型，对文本与目标情感嵌入向量进行融合，生成具有文本的语义和目标情感的目标合成语音。本申请还提供一种装置、设备及介质。此外，本申请还涉及区块链技术，文本、参考音频以及目标合成语音可存储于区块链中。本申请可以实现在语音合成中对情感表达的更为精细和灵活的控制。

技术关键词

坐标语音计算机可读指令球面文本情感类别音频编码器语义情感特征数值风格可读存储介质特征提取模块区块链技术特征值强度序列处理器

系统为您推荐了相关专利信息

一种基于RRT算法改进的机器人路径规划方法

机器人路径规划方法 RRT算法三次样条插值节点控制点

基于SAR图像的全天候无人机山火检测定位系统及工作方法

全天候无人机检测定位系统坐标系图像采集模块图像像素

一种镜头阴影校正方法、系统、电子设备和存储介质

成像模组镜头阴影校正方法坐标像素点非线性优化算法

一种面向长文档的自动化提示生成方法、装置及存储介质

生成提示词提示生成方法正确率排序模型输出提示词

一种天线近场校准方法、系统、电子设备及存储介质

轮廓数据场强探头近场校准方法坐标系机械臂

一种语音合成方法、装置、设备及介质

站点导航

APP 下载