摘要
本发明公开了一种基于去偏变分推断提示调优的图像识别方法,属于人工智能和计算机视觉领域。本发明将CLIP作为基准框架,该基准框架包括一个图像分支、一个文本分支;本发明基于图像分支,设计一种基于风格扰动的图像编码器,获得去偏的视觉特征;基于去偏的视觉特征和文本分支,设计一种基于去偏变分推断的文本编码器,获得去偏的文本特征;并通过设计的一种基于变分推断的损失函数,将训练集数据通过基于变分推断的损失函数最小化优化模型参数,得到参数最优的模型;将测试图像数据输入参数最优的模型得到图像识别结果。本发明为数据稀缺或受限场景提供了一种通用的小样本图像识别方法,在有限数据下仍能保持较高的识别准确率和泛化性能。
技术关键词
训练图像数据
令牌
视觉特征
图像编码器
图像识别方法
文本编码器
风格
分支
压缩图像数据
训练集数据
参数
样本
基准
图像块
框架
标签
系统为您推荐了相关专利信息
高精度定位系统
水下机器人
定位子系统
集群
多源融合
海报生成方法
注意力
周期性
布局
非易失性计算机可读存储介质
多层级特征
功率分配策略
数据接收设备
语义特征
传输方法