基于场景感知和自然语言描述的个性化语音合成方法、装置和设备

AITNT
正文
推荐专利
基于场景感知和自然语言描述的个性化语音合成方法、装置和设备
申请号:CN202510434793
申请日期:2025-04-08
公开号:CN120148475A
公开日期:2025-06-13
类型:发明专利
摘要
本申请提供了一种基于场景感知和自然语言描述的个性化语音合成方法、装置和设备,涉及语音合成技术领域,旨在生成兼具个性化、表现力且符合语境的语音。该方法包括:对第一文本进行语义分析,得到第一语义特征,所述第一文本包括文本内容和场景描述;根据所述第一语义特征进行场景分类生成,得到场景向量,所述场景向量表征场景类别;根据所述场景向量生成场景音特征;对第二文本进行语义分析,得到第二语义特征,所述第二文本至少包括语音风格的自然语言描述;根据所述第二语义特征进行情感类别预测和风格特征提取,得到风格控制参数;根据所述场景音特征和所述风格控制参数,对所述文本内容的合成语音参数进行调整,得到合成语音。
技术关键词
语义特征 风格 情感类别 个性化语音 自然语言 生成场景 情感分析模型 表征场景 场景分类 音频特征 模板 参数 分析模块 文本编码器 分词 标签
系统为您推荐了相关专利信息
1
基于大语言模型的数据库语句生成方法及相关装置
语义结构 生成语句 大语言模型 数据库语句生成方法 语法结构
2
知识问答与知识内容处理方法、设备、存储介质及程序产品
重构模型 问答知识库 问答页面 模版 工作流
3
关联信息提取方法、装置、设备、介质及计算机程序产品
信息提取方法 逻辑 数据 计算机程序产品 字典
4
一种对变电站防汛能力进行评估的方法及系统
人工智能模型 水文参数 变电站防汛 序列 建筑物
5
一种小样本肠道息肉图像语义分割方法
图像语义分割方法 原型 分支 编码特征 视觉特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号