图文对比学习的多模态人脸活体检测方法、介质及设备

正文

推荐专利

申请号：CN202411815959

申请日期：2024-12-11

公开号：CN119763199B

公开日期：2025-10-28

类型：发明专利

摘要

本发明提供了一种图文对比学习的多模态人脸活体检测方法、介质及设备；方法是：采用CLIP网络架构来实现人脸活体检测；CLIP网络架构包括文本编码器、图像编码器和多模态信息融合模块；将真假脸标签扩展出文本提示集，并送入文本编码器获得文本特征；将人脸图像三个模态分别输入到图像编码器提取图像特征；将三个模态图像特征分别与文本特征进行计算余弦相似度得到分类概率；若任一个模态分类概率置信度高，则直接得到检测结果；若三个模态置信度均不高，将三个模态图像特征融合后与文本特征进行计算余弦相似度，得到检测结果。该方法充分利用CLIP预训练模型蕴含跨模态知识，提取人脸图像和文本提示的基础特征，提高了模型的泛化能力。

技术关键词

人脸活体检测方法图像编码器网络架构文本编码器融合图像特征人脸图像数据图文交叉注意力机制图像块多模态信息融合拼接方式执行存储器存储图像全局特征词嵌入方法

系统为您推荐了相关专利信息

基于多模态大模型的问答数据处理方法及系统

编码向量问答数据处理方法上下文特征语义内核

基于持续学习与知识蒸馏的中文医疗连续实体识别方法

跨度实体识别方法知识蒸馏技术 GRU模型 sigmoid函数

一种智能体及其室内导航方法、设备、介质及产品

室内导航方法语音识别单元多模态定位单元场景

一种面向高泥沙含量湖库的区域营养盐基准制定方法

营养盐神经网络模型指标基准超参数

一种文本引导的弱标注浮选泡沫分割与计数方法及系统

浮选泡沫计数方法文本关键点图像编码器

图文对比学习的多模态人脸活体检测方法、介质及设备

站点导航

APP 下载