基于互信息的强度可控的情感语音合成方法

AITNT
正文
推荐专利
基于互信息的强度可控的情感语音合成方法
申请号:CN202410855072
申请日期:2024-06-28
公开号:CN118711563A
公开日期:2024-09-27
类型:发明专利
摘要
本发明公开了基于互信息的强度可控的情感语音合成方法,首先目标语音标注;然后情感强度计算、建模情感表示、强度属性、文本表示,然后将得到的情感嵌入、强度嵌入和文本嵌入送入时长预测器,生成预测的音素时长;最后语谱图解码:利用语谱图解码器将音素时长转换为预测频谱图;情感语音合成。本发明旨在合成与目标情感一致的情感语音,并实现对情感强度的灵活控制,使合成语音能够生动地表达所需的情感。
技术关键词
语谱图 文本编码器 强度 语音特征 情感分类器 解码器 时域特征 注意力 频域特征 门控循环单元 深度神经网络 时间段 样本 标记 多层感知机
系统为您推荐了相关专利信息
1
一种基于AI问答的数据处理方法及其系统
数据处理方法 环境光线强度 知识点 答案 人工智能交互技术
2
一种正向深孔大爆破放顶实现残矿回收的方法
三维激光扫描仪 孔道 裂缝 三维模型 注浆
3
一种语音识别方法、装置、设备及存储介质
语音特征 语音识别模型 语音识别方法 特征提取模块 处理单元
4
一种基于人工智能的语音处理方法和装置
降噪模型 降噪需求 语音特征 说话人识别技术 数据
5
基于向量化与序列到序列代理模型的地震需求预测方法
需求预测方法 钢筋混凝土框架结构 序列 地震 拉丁超立方采样
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号