视觉语言预训练的课程式全局正负样本采样方法、装置和设备

正文

推荐专利

申请号：CN202510203802

申请日期：2025-02-24

公开号：CN120107721A

公开日期：2025-06-06

类型：发明专利

摘要

本申请提供了一种视觉语言预训练的课程式全局正负样本采样方法、装置和设备，涉及计算机技术领域，旨在实现全局正负样本采样，以对模型进行更好的训练。该方法包括：对训练数据集进行邻居计算和全局聚类，得到不同的聚类、以及各个样本的邻居样本；将训练数据集中文本和图像不匹配的样本，确定为噪声样本，并根据噪声样本的邻居样本构造一个新文本，对噪声样本的文本进行替换，得到跨模态正样本；将训练数据集中相似的图像，作为单模态正样本；根据跨模态正样本和单模态正样本，构建正样本数据集；按照不同的聚类，从正样本数据集中采样多个正样本作为一个训练批次的训练样本，训练样本用于训练视觉语言模型。

技术关键词

噪声样本样本采样方法邻居文本跨模态视觉数据聚类图像匹配样本采样装置语义采样模块处理器存储器编码电子设备频率

系统为您推荐了相关专利信息

基于AI的新媒体智能营销方法

智能营销方法视觉焦点区域文本情感倾向媒体指数

一种自动化测试管理方法、装置、设备及介质

自动化测试管理仿真数据指标复杂度编排技术

一种用于空天地立体化异构网络的智融协同传输方法

协同传输方法李雅普诺夫函数传输路径异构标志位

跨领域小样本异常检测方法、装置、电子设备及存储介质

异常检测方法图像重建语义样本文本

一种基于多轮迭代的隐私增强型智能搜索方法及系统

智能搜索方法联邦学习技术动态优先级排序跨模态数据语义向量

视觉语言预训练的课程式全局正负样本采样方法、装置和设备

站点导航

APP 下载