一种基于多模态异常值合成的视觉语言模型分布外样本检测方法

正文

推荐专利

申请号：CN202510671596

申请日期：2025-05-23

公开号：CN120687829A

公开日期：2025-09-23

类型：发明专利

摘要

本发明公开了一种基于多模态异常值合成的视觉语言模型分布外样本检测方法，包括：基于少量分布内图像样本，通过对图像内容的语义特征分析与采样，生成与分布内语义密切相关的、高质量的图像和文本形式的多模态分布外样本，然后构建融合分布内样本与合成分布外样本的图像原型与文本原型，在推理过程中，采用图像与文本双模态原型匹配机制，同时进行相似度计算，接着在此基础上，提出多模态原型匹配得分综合评估待测样本与分布内类别之间的相似性。本发明能够基于少量分布内样本自动生成具有图像和文本标签的分布外样本，提升模型在多模态分布外检测任务中的泛化能力和鲁棒性。

技术关键词

样本检测方法图像嵌入原型图像编码器视觉语义标签图像特征向量多模态信息文本编码器训练集数据图像分割模型切块聚类重叠面积

系统为您推荐了相关专利信息

一种自适应优化动态区域的视觉SLAM方法、系统

视觉SLAM方法动态物体掩膜特征点图像

模拟无人零售正常消费场景的智能机械臂系统及其方法

智能机械臂系统智能算法模块强化学习算法决策场景

基于全局-局部注意力交互机制显著性目标检测的方法

局部注意力交互局部注意力机制深度图信息通道输入解码器

基于视觉识别的火灾预警方法及系统

火灾预警方法视觉特征视频火灾预警系统画面

视觉场与辐射场相结合的核环境监测系统及方法

噪声抑制环境监测方法环境监测系统灰度矩阵 CMOS传感器

一种基于多模态异常值合成的视觉语言模型分布外样本检测方法

站点导航

APP 下载