情感语音合成方法、装置、计算机设备及可读存储介质

AITNT
正文
推荐专利
情感语音合成方法、装置、计算机设备及可读存储介质
申请号:CN202510014427
申请日期:2025-01-03
公开号:CN119741911B
公开日期:2025-09-30
类型:发明专利
摘要
本发明涉及人工智能及语音合成技术领域,公开了一种情感语音合成方法、装置、计算机设备及可读存储介质,包括:获取待进行语音合成的目标文本,识别所述目标文本的情感向量表示;对所述情感向量表示进行情感风格预测,得到情感风格权重;基于预训练的声学模型,确定所述目标文本的音素嵌入序列,以及控制所述声学模型采用所述情感风格权重对所述音素嵌入序列进行调整,以使所述声学模型利用调整后的所述音素嵌入序列生成所述目标文本的情感语音。即使在没有专业音频素材或情感标注的情况下,也能获得具有高度情感表达力的语音输出,提升了模型的泛化能力。
技术关键词
样本 文本编码器 训练语言模型 风格 语音 序列 适配器 训练声学模型 解码器 情感类别 计算机设备 可读存储介质 误差 处理器 声码器 识别模块 存储器
系统为您推荐了相关专利信息
1
一种智能运维知识库构建方法
运维知识库 智能诊断模型 梯度提升决策树 关系网络 实体
2
一种基于大语言模型的用户风险行为感知方法及相关设备
大语言模型 风险 社交媒体平台 文本 异常用户
3
一种钛合金显微组织检测方法及装置
组织检测方法 钛合金 深度学习模型 电子背散射衍射 样本
4
基于图信号卷积神经网络的工业互联网缺损数据估计方法
数据估计方法 神经网络模型 工业互联网技术 样本 节点特征
5
一种基于政务系统结构化及非结构化数据的清洗分析方法及系统
政务系统 关键词 分析方法 索引 指针
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号