基于场景感知和自然语言描述的个性化语音合成方法、装置和设备

正文

推荐专利

申请号：CN202510434793

申请日期：2025-04-08

公开号：CN120148475A

公开日期：2025-06-13

类型：发明专利

摘要

本申请提供了一种基于场景感知和自然语言描述的个性化语音合成方法、装置和设备，涉及语音合成技术领域，旨在生成兼具个性化、表现力且符合语境的语音。该方法包括：对第一文本进行语义分析，得到第一语义特征，所述第一文本包括文本内容和场景描述；根据所述第一语义特征进行场景分类生成，得到场景向量，所述场景向量表征场景类别；根据所述场景向量生成场景音特征；对第二文本进行语义分析，得到第二语义特征，所述第二文本至少包括语音风格的自然语言描述；根据所述第二语义特征进行情感类别预测和风格特征提取，得到风格控制参数；根据所述场景音特征和所述风格控制参数，对所述文本内容的合成语音参数进行调整，得到合成语音。

技术关键词

语义特征风格情感类别个性化语音自然语言生成场景情感分析模型表征场景场景分类音频特征模板参数分析模块文本编码器分词标签

系统为您推荐了相关专利信息

基于大语言模型的数据库语句生成方法及相关装置

语义结构生成语句大语言模型数据库语句生成方法语法结构

知识问答与知识内容处理方法、设备、存储介质及程序产品

重构模型问答知识库问答页面模版工作流

关联信息提取方法、装置、设备、介质及计算机程序产品

信息提取方法逻辑数据计算机程序产品字典

一种对变电站防汛能力进行评估的方法及系统

人工智能模型水文参数变电站防汛序列建筑物

一种小样本肠道息肉图像语义分割方法

图像语义分割方法原型分支编码特征视觉特征

基于场景感知和自然语言描述的个性化语音合成方法、装置和设备

站点导航

APP 下载