摘要
本申请提供了一种多媒体数据生成方法、系统、电子设备及存储介质,涉及多媒体处理技术领域,其中,该方法包括:获取待处理多媒体数据,其中,待处理多媒体数据中包括目标音频数据;对目标音频数据进行识别得到目标文本字幕,以及对目标音频数据进行分析得到情感分析结果;根据目标文本字幕和情感分析结果生成对应的目标人脸动画数据,其中,目标人脸动画数据包括嘴型数据;通过目标长短期记忆网络模型对目标音频数据、目标文本字幕及目标人脸动画数据进行同步处理,得到目标多媒体数据。实施本申请提供的技术方案,达到了提高多媒体数据的生成效率的效果。
技术关键词
生成对抗网络模型
长短期记忆网络
多媒体
字幕
人脸
音频
文本
时域特征
参数
数据生成系统
样本
唇形动画
梯度下降算法
电子设备
可读存储介质
视频帧
系统为您推荐了相关专利信息
水文数据采集系统
气象数据采集系统
无人机巡航系统
强化学习算法
遥感数据处理系统
深度学习模型
重构方法
多源异构数据
空间特征提取
特征提取模块
疲劳驾驶检测
疲劳检测方法
分支
驾驶员疲劳状态
车载终端设备
智能交通管控
深度Q网络
控制策略
长短期记忆网络
桥梁健康状态
智能监控方法
监控视频流
动态
画面
计算机程序代码