一种多模态情感驱动文字转语音的方法、系统及设备

AITNT
正文
推荐专利
一种多模态情感驱动文字转语音的方法、系统及设备
申请号:CN202510140395
申请日期:2025-02-08
公开号:CN120496496A
公开日期:2025-08-15
类型:发明专利
摘要
本发明提出了一种多模态情感驱动文字转语音的方法、系统及设备,包括如下步骤:S1,输入待处理文本,进行情感分析,识别所述待处理文本的情感特征;S2,输入用户提供的语音数据,提取所述语音数据的个性化语音特征;S3,融合所述情感特征和所述个性化语音特征,生成联合特征向量,所述联合特征向量嵌入深度学习模型进行语音合成;S4,输入待处理文本和联合特征向量,通过深度学习模型,生成音频波形;S5,分析待处理文本的语境,调整和优化音频波形,得到最终语音结果;通过将多模态情感分析与用户情绪状态相结合,利用深度学习模型实现个性化语音定制,语境理解模块能够根据上下文信息智能调整语音特征,提高了语音的自然度和适应性。
技术关键词
个性化语音特征 情感特征 深度学习模型 状态监测单元 文本 分析单元 语音特征提取 数据采集单元 多模态 多任务学习方法 特征提取模块 波形 情绪状态信息 处理器执行指令 音频 迁移学习技术 个性化特征
系统为您推荐了相关专利信息
1
一种基于流式计算的神经网络加速装置和方法
神经网络加速装置 模块 神经网络加速方法 流水线 数据传输延迟
2
基于多方法融合的互联网和中医护理服务人才综合评价系统
综合评价系统 评价指标体系 动态 网络 互联网
3
一种基于视觉语言模型的自动化动作轨迹标注系统及方法
关键帧 场景变化检测 标注系统 标注方法 结构化自然语言
4
一种对培养植物幼苗的玻璃瓶内部进行微生物检测的方法
玻璃瓶 瓶身 图像 深度学习模型 真菌
5
基于拼音及声纹编码的语音通信方法及低功耗语音终端
通信转换方法 拼音 语音识别模块 无线通信模块 语音通信方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号