一种基于CLIP和多模态掩码提示学习的面部动作单元识别的方法

正文

推荐专利

申请号：CN202411369738

申请日期：2024-09-29

公开号：CN119399809B

公开日期：2025-09-23

类型：发明专利

摘要

本发明公开了一种基于CLIP和多模态掩码提示学习的面部动作单元识别的方法，包括以下步骤；步骤1：基于AU先验位置设计多模态共享的AU提示(AU‑prompt)和注意力掩码，所述AU‑prompt包含多个可学习的token，所述注意力掩码根据不同AU面部肌肉变化的先验位置进行设计，得到特定的AU注意力掩码；步骤2：在多模态提示学习的过程中，将特定AU的注意力掩码引入CLIP模型文本和图像编码器的不同层进行提示学习，同时学习AU局部细节特征和不同AU间全局关联特征，得到局部特征和全局特征；步骤3：将局部特征和全局特征进行融合，并与文本特征计算损失，最终实现AU识别。本发明能够在标注数据有限的情况下，有效地识别面部动作单元。

技术关键词

面部动作单元识别图像编码器文本编码器局部细节特征视觉分支注意力机制图像特征向量识别面部多模态线性生成方式标签定义数据

系统为您推荐了相关专利信息

一种基于视觉识别的电厂冷却水消泡自动控制系统

自动控制系统冷却水高清摄像头排水口视觉

一种疲劳驾驶的检测方法、装置及电子设备

疲劳驾驶检测融合特征检测驾驶员疲劳驾驶交互特征图像

一种基于大数据的智能广告内容生成与优化系统

染色体元素数据采集模块分析模块客户

用户交互方法、存储介质以及用户交互系统

偏好特征互动反馈信息情感识别模型环境采集设备语音采集设备

视频生成方法、装置、电子设备及计算机可读存储介质

文本生成场景视频生成方法大语言模型音频

一种基于CLIP和多模态掩码提示学习的面部动作单元识别的方法

站点导航

APP 下载