一种基于图像-文本预训练模型的少样本分类方法

AITNT
正文
推荐专利
一种基于图像-文本预训练模型的少样本分类方法
申请号:CN202410891628
申请日期:2024-07-04
公开号:CN118747313A
公开日期:2024-10-08
类型:发明专利
摘要
本发明属于计算机视觉技术领域,公开了一种基于图像‑文本预训练模型的少样本分类方法。对于基元级最优运输,提出基于原型距离的图像块重加权机制。将原型和图像块之间的欧氏距离转换为每个图像块的权重,从而为图像块分配不同的权值。针对提示级阶段,提出级联最优运输模块,不仅考虑少样本图像‑文本特征之间的最优运输,还考虑零样本和少样本图像‑文本特征之间的交叉最优运输。提出一种基于原型的非平衡一致性损失函数来监督网络。该损失函数分为原型距离损失和非平衡一致性损失。在Caltech01、DTD、EuroSAT数据集上进行测试,从实验结果可以证明本发明所提出的网络模型性能优于目前最先进的算法,验证了算法的有效性。
技术关键词
样本分类方法 基元 预训练模型 原型 分支 图像块 运输模块 分类网络 文本编码器 图像编码器 代表 特征提取模块 计算机视觉技术 矩阵 定义 计算方法 标签
系统为您推荐了相关专利信息
1
一种分布式光纤传感扰动信号识别方法
分布式光纤传感 信号识别方法 声光调制器 超窄线宽激光器 掺铒光纤放大器
2
一种管道巡检机器人
管道巡检机器人 行走轮组件 关节 球形轮 传动齿轮组
3
一种交通路网多模态感知的异常事件预警方法、系统
异常事件 多模态 车辆状态信息 原型 预警方法
4
一种车载音频控制方法、系统、设备及介质
音频控制方法 座位 联合聚类方法 震动传感器 人物模型
5
融合微震基本数据及其物理指标的冲击地压危险预测方法
危险预测方法 特征提取模块 分支 微震事件 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号