摘要
本申请提供了一种人脸表情的预测方法、装置、介质和系统。通过图生图参数预测模型和图生图模型这样的稳定扩散模型,相比现有方案可大幅提升表情预测的精度和真实感,在生成多帧表情图像后,提出了通过时间戳匹配和相似度筛选的方式来筛选出高质量的预测图像,能够自动选择最接近真实表情变化的图像,避免了传统方案中对时序关系的过度依赖,减少了手动标注的需求,从而解决了现有方案的人脸表情预测对标注数据的质量要求较高,从而无法应用于复杂场景的问题。
技术关键词
人脸表情
深度学习模型
生成预测图像
参数
噪声级别
可读存储介质
损失函数优化
处理单元
图像重建
预测系统
预测装置
程序
计算机
真实感
场景
存储器
基准
处理器
系统为您推荐了相关专利信息
握笔姿势
压电振动部件
异常信息
终端设备
压电陶瓷层
等效电路模型
锂离子电池充放电
网格模型数据
矩阵
非线性特征
LSTM模型
音乐生成方法
序列
数据
深度学习模型
局部优化模型
解算方法
深度学习模型
编码器参数
多源融合
驾驶员脱手警示
驾驶环境信息
灯光
驾驶员对方向盘
参数