摘要
本申请实施例提供了一种基于多模态的风险诊断方法和装置、电子设备及存储介质,属于金融科技和人工智能技术领域。该方法包括:通过对原始用户图像数据进行人脸属性检测,对原始用户视频数据进行脸部动作检测,以及对原始业务文本数据进行文本特征提取,并将检测到的人脸属性特征、脸部动作特征及业务文本特征进行融合,得到目标风险特征,对目标风险特征进行风险诊断。本申请实施例将人脸属性特征、脸部动作特征及业务文本特征进行融合,得到目标风险特征,并对目标风险特征进行风险诊断,模型能够捕捉到文本、图像及视频数据之间的关联关系,避免了因诊断员差异导致的对同一用户的主观评级误差,从而提高了用户风险诊断的准确率。
技术关键词
人脸属性
动作特征
文本
风险
多模态
注意力
脸部关键点
诊断方法
交互特征
视觉特征
深层特征提取
数据
网络
视频
表情特征
运动特征
图像
电子设备