基于自适应多模态提示学习的图像分类方法

正文

推荐专利

基于自适应多模态提示学习的图像分类方法

申请号：CN202411491827

申请日期：2024-10-24

公开号：CN119445218A

公开日期：2025-02-14

类型：发明专利

摘要

本发明公开了一种自适应多模态提示学习方法，该方法利用大规模视觉语言模型的潜力，通过图像提示和文本提示的协作，提升了样本内和样本外的泛化能力。通过掩蔽图像中的无意义块并采用自适应交互学习机制，本发明有效增强了多模态信息的相互协作和共享，从而在处理少量样本和未见过的类别时，能够稳健地学习图像和文本之间的深层语义联系。在无需大规模微调模型参数的情况下，本发明结合了现有提示学习方法的优势，为多模态任务提供了高效的解决方案。大量实验表明，本发明在多个基准数据集上的性能均优于现有最先进的方法。

技术关键词

图像分类方法图像编码器矩阵意义图像图像块生成交互信息多模态图像投影学习方法参数样本补丁文本编码器网络元素填充方法预测类别图像分割

系统为您推荐了相关专利信息

主被动混合雷达目标探测的功率分配与天线选择方法

NP准则天线功率雷达系统检测器

一种基于多跳中继与动态误差补偿的水下航行器协同导航定位方法及装置

超短基线水声定位系统协同导航定位方法远距离无人潜航器动态误差补偿

一种水下遥控潜水器及其空间定位方法

空间定位方法声呐遥控潜水器无迹卡尔曼滤波算法协方差矩阵

基于工业物联网的工艺方案生成方法、装置、终端和介质

工业物联网车间网络平台环境检测设备数据采集设备

基于声场方向识别的发声设备自适应调节方法、系统

音源特征发声设备麦克风单元解析算法声场特征

基于自适应多模态提示学习的图像分类方法

站点导航

APP 下载