摘要
本申请涉及一种基于视觉语言模型的金丝猴面部识别方法,不需要对金丝猴面部图像进行精细的标注,而是引入了额外的文本信息,这些文本信息以一种弱监督的形式存在,更易于收集和获取;并且通过描述文本可以与图像内容关联起来,提高模型对图像语义的理解能力,从而提高对细粒度特征的抽取能力。
技术关键词
面部识别模型
面部识别方法
文本
图像编码器
数据
样本
面部识别装置
视觉
细粒度特征
模型训练模块
可读存储介质
图片
分类器
计算机程序产品
识别模块
处理器
指令
系统为您推荐了相关专利信息
电力供配电
切换系统
设备健康评估
电流相位信号
机械式接触器
风险评估模型
风险评估方法
风险评估系统
对象
关系
多肽
双向长短期记忆网络
训练深度学习模型
样本
生物活性肽技术
易发性预测方法
模型超参数
因子
输电线路铁塔
搜索算法优化