一种基于强迫提示词学习的视觉语言模型分布外检测方法及装置

AITNT
正文
推荐专利
一种基于强迫提示词学习的视觉语言模型分布外检测方法及装置
申请号:CN202510760102
申请日期:2025-06-09
公开号:CN120673144A
公开日期:2025-09-19
类型:发明专利
摘要
本发明公开了一种基于强迫提示词学习的视觉语言模型分布外检测方法及装置,方法包括:获取下游任务分布内图像数据集划分小样本训练集和分布内外测试集;构建视觉语言模型分布外检测框架,利用强迫提示词与初始提示词分别获得强迫文本特征与初始文本特征,并结合图像特征计算交叉熵损失;使用预训练的视觉语言模型权重对图像与文本编码器端的参数进行初始化,在构建的小样本分布内训练集上进行端到端的迭代训练,优化损失;将分布内与分布外测试集输入训练好的视觉语言型,结合模型输出的图文特征与分布外检测得分数,输出分布外检测结果。本发明在不牺牲视觉语言模型分类性能的同时,有效提升模型检测分布外样本的能力。
技术关键词
外检测方法 文本编码器 图像编码器 视觉 训练集 计算机程序指令 模型训练模块 图文 特征提取模块 数据处理模块 局部图像特征 框架 随机梯度下降 输入端 预训练模型 处理器 样本 电子设备
系统为您推荐了相关专利信息
1
一种锂离子电池状态预测方法
锂离子电池 状态预测方法 等效电路模型 电压采集组件 LSTM模型
2
一种基于时空信息聚合的视频特征提取模型训练方法、系统及特征提取方法
模型训练方法 视觉特征 标签特征 视频帧特征 摘要
3
一种带肿瘤离体器官教学模型及其制备方法
教学模型 肿瘤 医学影像数据 图像处理软件 计算机断层扫描
4
水下机器人无线充电位置自主匹配方法、充电模块及系统
位置识别单元 无线充电位置 空间六自由度运动 矢量推进器 水下机器人
5
基于预训练大语言模型的油气井产量预测方法及装置
油气井产量 归一化模块 序列 计算机执行指令 大语言模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号