一种基于强迫提示词学习的视觉语言模型分布外检测方法及装置

正文

推荐专利

申请号：CN202510760102

申请日期：2025-06-09

公开号：CN120673144A

公开日期：2025-09-19

类型：发明专利

摘要

本发明公开了一种基于强迫提示词学习的视觉语言模型分布外检测方法及装置，方法包括：获取下游任务分布内图像数据集划分小样本训练集和分布内外测试集；构建视觉语言模型分布外检测框架，利用强迫提示词与初始提示词分别获得强迫文本特征与初始文本特征，并结合图像特征计算交叉熵损失；使用预训练的视觉语言模型权重对图像与文本编码器端的参数进行初始化，在构建的小样本分布内训练集上进行端到端的迭代训练，优化损失；将分布内与分布外测试集输入训练好的视觉语言型，结合模型输出的图文特征与分布外检测得分数，输出分布外检测结果。本发明在不牺牲视觉语言模型分类性能的同时，有效提升模型检测分布外样本的能力。

技术关键词

外检测方法文本编码器图像编码器视觉训练集计算机程序指令模型训练模块图文特征提取模块数据处理模块局部图像特征框架随机梯度下降输入端预训练模型处理器样本电子设备

系统为您推荐了相关专利信息

一种锂离子电池状态预测方法

锂离子电池状态预测方法等效电路模型电压采集组件 LSTM模型

一种基于时空信息聚合的视频特征提取模型训练方法、系统及特征提取方法

模型训练方法视觉特征标签特征视频帧特征摘要

一种带肿瘤离体器官教学模型及其制备方法

教学模型肿瘤医学影像数据图像处理软件计算机断层扫描

水下机器人无线充电位置自主匹配方法、充电模块及系统

位置识别单元无线充电位置空间六自由度运动矢量推进器水下机器人

基于预训练大语言模型的油气井产量预测方法及装置

油气井产量归一化模块序列计算机执行指令大语言模型

一种基于强迫提示词学习的视觉语言模型分布外检测方法及装置

站点导航

APP 下载