基于多模态融合与文本增强的面部动作单元识别方法及系统

正文

推荐专利

申请号：CN202510431010

申请日期：2025-04-08

公开号：CN120375440A

公开日期：2025-07-25

类型：发明专利

摘要

本发明公开了一种基于多模态融合与文本增强的面部动作单元识别方法及系统，包括：视觉语言模型提取出面部图像属性集合，基于面部图像属性集合构建自适应文本提示词，采用CLIP对自适应文本提示词进行处理，得到文本语义特征；面部关键点检测模型提取出面部关键点特征；面部表情识别模型提取出面部表情特征；图像语义特征融合模块对面部关键点特征和面部表情特征进行处理，得到多模态图像语义特征；将多模态图像语义特征与文本语义特征输入到多模态特征融合模块，得到文本信息增强后的多模态融合特征；实现对面部图像的面部动作单元的识别。本发明能增强跨模态特征的互补性与联合表征的鲁棒性，有效提升了复杂场景下面部动作的识别精度。

技术关键词

面部表情识别模型面部图像数据面部关键点检测语义特征面部表情特征文本融合特征多模态特征融合面部动作单元注意力出面部图像多尺度自然语言模块

系统为您推荐了相关专利信息

带视觉去模糊的堆叠冲压零件识别及缺陷检测方法

缺陷检测方法零件图像网络结构视觉

一种基于人工智能的移动机器人语音数据控制方法及系统

数据控制方法语音特征移动机器人语音识别文本运动补偿

基于环境声学特征的耳机佩戴状态识别方法和相关设备

耳机佩戴状态声学特征振动特征识别方法耳机麦克风

基于词义聚合和语义分离技术的加密流量分类方法及系统

语义特征加密流量分类方法网络流量数据编码器多层感知器

一种用于ERP系统的多语言快速处理方法

ERP系统多语言矩阵语义特征语法结构

基于多模态融合与文本增强的面部动作单元识别方法及系统

站点导航

APP 下载