摘要
本发明公开了基于双重共享机制的小样本分类方法及系统,涉及计算机视觉技术领域。本发明包括:接收文本及图像信息并进行预处理;构建视觉语言模型,使用损失函数对视觉语言模型进行监督训练,直至收敛,得到训练后的视觉语言模型;训练后的视觉语言模型包括文本编码器与视觉编码器,将预处理后的文本与图像信息输入视觉语言模型中得到文本特征和图像特征。本发明引入了模态间共享系数,促进了文本提示符和视觉提示符之间的深度跨模态交互,增强了视觉语言模型中视觉特征与文本特征的对齐,并且提出了模态内共享矩阵,旨在保持参数和计算效率的同时,进一步优化模型性能,保持了准确性和效率之间的权衡。
技术关键词
样本分类方法
文本编码器
瓶颈结构
适配器
机制
跨模态
注意力
样本分类系统
图像嵌入
矩阵
计算机视觉技术
岩石识别
模型训练模块
生成特征
视觉特征
图像分割
系统为您推荐了相关专利信息
关系联合抽取方法
网络安全实体
网络威胁情报
节点特征
注意力机制
交通标志识别方法
联合损失函数
双线性插值
多尺度特征融合
生成多尺度
水利设施
运维方法
级联故障
故障诊断信息
知识图谱推理算法