基于人工智能的语音合成方法、装置、计算机设备及介质

正文

推荐专利

申请号：CN202411014388

申请日期：2024-07-25

公开号：CN118840998A

公开日期：2024-10-25

类型：发明专利

摘要

本申请属于人工智能领域与金融科技领域，涉及一种基于人工智能的语音合成方法，包括：获取长句文本；获取与长句文本对应的历史上下文语句；获取与长句文本对应的历史时刻的语音信息；基于风格预测器与历史上下文语句对长句文本进行风格预测得到第一风格嵌入；基于风格提取器对语音信息进行风格提取得到第二风格嵌入；基于第一风格嵌入与第二风格嵌入生成目标风格嵌入；基于目标风格嵌入与语音合成模型对长句文本进行语音合成生成目标语音。本申请还提供一种基于人工智能的语音合成装置、计算机设备及存储介质。本申请使用目标风格嵌入与语音合成模型调整长句文本的语音合成过程，实现了生成韵律衔接连贯、听感良好且具有高表达性的目标语音。

技术关键词

风格语音位置编码器文本计算机可读指令语句声码器序列计算机设备训练语言模型解码器可读存储介质模块处理器存储器策略金融

系统为您推荐了相关专利信息

语音唤醒方法、装置、设备及介质

空间滤波器语音唤醒方法麦克风阵列噪声数据语音唤醒装置

一种基于多模态大模型的无人机巡检图像智能分拣方法

图像编码器文本编码器无人机巡检图像智能分拣方法 Siamese网络

一种基于人工智能驱动的情感分析系统及方法

人工智能驱动情感分析系统关键词文本情感分析方法

基于大语言模型的文本信息结构化恢复方法、系统及应用

大语言模型恢复方法文本语义结构嵌套结构

一种基于大数据技术的知识产权管理方法

大数据技术管理方法主题企业风险

基于人工智能的语音合成方法、装置、计算机设备及介质

站点导航

APP 下载