一种基于去偏变分推断提示调优的图像识别方法

AITNT
正文
推荐专利
一种基于去偏变分推断提示调优的图像识别方法
申请号:CN202510012396
申请日期:2025-01-06
公开号:CN119418137B
公开日期:2025-03-18
类型:发明专利
摘要
本发明公开了一种基于去偏变分推断提示调优的图像识别方法,属于人工智能和计算机视觉领域。本发明将CLIP作为基准框架,该基准框架包括一个图像分支、一个文本分支;本发明基于图像分支,设计一种基于风格扰动的图像编码器,获得去偏的视觉特征;基于去偏的视觉特征和文本分支,设计一种基于去偏变分推断的文本编码器,获得去偏的文本特征;并通过设计的一种基于变分推断的损失函数,将训练集数据通过基于变分推断的损失函数最小化优化模型参数,得到参数最优的模型;将测试图像数据输入参数最优的模型得到图像识别结果。本发明为数据稀缺或受限场景提供了一种通用的小样本图像识别方法,在有限数据下仍能保持较高的识别准确率和泛化性能。
技术关键词
训练图像数据 令牌 视觉特征 图像编码器 图像识别方法 文本编码器 风格 分支 压缩图像数据 训练集数据 参数 样本 基准 图像块 框架 标签
系统为您推荐了相关专利信息
1
一种水下机器人集群协同作业的高精度定位系统
高精度定位系统 水下机器人 定位子系统 集群 多源融合
2
基于周期性稀疏变换的海报生成方法、装置、设备及介质
海报生成方法 注意力 周期性 布局 非易失性计算机可读存储介质
3
一种跨模态聚类引导图像编码器的训练方法
图像编码器 跨模态 局部图像特征 医学 报告
4
多层级特征多播传输方法、装置、设备、存储介质及产品
多层级特征 功率分配策略 数据接收设备 语义特征 传输方法
5
一种业务请求交互方法、设备、介质及程序产品
交互方法 客户端 服务端 语义 识别码
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号