摘要
本发明公开了一种基于强迫提示词学习的视觉语言模型分布外检测方法及装置,方法包括:获取下游任务分布内图像数据集划分小样本训练集和分布内外测试集;构建视觉语言模型分布外检测框架,利用强迫提示词与初始提示词分别获得强迫文本特征与初始文本特征,并结合图像特征计算交叉熵损失;使用预训练的视觉语言模型权重对图像与文本编码器端的参数进行初始化,在构建的小样本分布内训练集上进行端到端的迭代训练,优化损失;将分布内与分布外测试集输入训练好的视觉语言型,结合模型输出的图文特征与分布外检测得分数,输出分布外检测结果。本发明在不牺牲视觉语言模型分类性能的同时,有效提升模型检测分布外样本的能力。
技术关键词
外检测方法
文本编码器
图像编码器
视觉
训练集
计算机程序指令
模型训练模块
图文
特征提取模块
数据处理模块
局部图像特征
框架
随机梯度下降
输入端
预训练模型
处理器
样本
电子设备
系统为您推荐了相关专利信息
锂离子电池
状态预测方法
等效电路模型
电压采集组件
LSTM模型
模型训练方法
视觉特征
标签特征
视频帧特征
摘要
教学模型
肿瘤
医学影像数据
图像处理软件
计算机断层扫描
位置识别单元
无线充电位置
空间六自由度运动
矢量推进器
水下机器人
油气井产量
归一化模块
序列
计算机执行指令
大语言模型