基于多模态大语言模型的人脸活体检测方法、装置、设备及存储介质

AITNT
正文
推荐专利
基于多模态大语言模型的人脸活体检测方法、装置、设备及存储介质
申请号:CN202510333861
申请日期:2025-03-20
公开号:CN120388404A
公开日期:2025-07-29
类型:发明专利
摘要
本申请公开了一种基于多模态大语言模型的人脸活体检测方法、装置、设备及存储介质,涉及图像检测技术领域,包括:将待识别人脸图像、目标辅助模态图像以及用户指令输入训练好的多模态大语言模型中,得到针对所述用户指令的多任务输出结果,其中,所述多模态大语言模型包括视觉令牌掩码器,所述多任务输出结果包括粗粒度分类结果、细粒度分类结果、原因推理结果以及攻击定位结果中的至少一种。本申请能够提高人脸活体检测的安全性以及可靠性。
技术关键词
大语言模型 识别人脸图像 人脸活体检测方法 视觉特征 多模态 可见光图像 多任务 细粒度分类 令牌 文本 人脸活体检测设备 图像块 人脸活体检测装置 梯度直方图 数据 指令
系统为您推荐了相关专利信息
1
基于机器学习的舰船控制辅助方法
燃油 能耗 舰船结构 强化学习模型 数据
2
一种面向多模态神经信号的上下文语义协同建模方法
语义协同 特征值 语义注意力 多头注意力机制 多模态
3
一种口腔内视镜多模态动态跟踪装置
动态跟踪装置 导光管 虚拟现实眼镜 压力传感器阵列 动态补偿模块
4
一种用于边缘设备的大语言模型优化方法和系统
设备参数信息 语言模型优化方法 大语言模型 资源 集群
5
基于语义特征和视觉特征融合的全景图像质量评价方法
语义特征 视觉感知特征 全景图 采样模块 局部视觉特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号