视觉语言预训练的课程式全局正负样本采样方法、装置和设备

AITNT
正文
推荐专利
视觉语言预训练的课程式全局正负样本采样方法、装置和设备
申请号:CN202510203802
申请日期:2025-02-24
公开号:CN120107721A
公开日期:2025-06-06
类型:发明专利
摘要
本申请提供了一种视觉语言预训练的课程式全局正负样本采样方法、装置和设备,涉及计算机技术领域,旨在实现全局正负样本采样,以对模型进行更好的训练。该方法包括:对训练数据集进行邻居计算和全局聚类,得到不同的聚类、以及各个样本的邻居样本;将训练数据集中文本和图像不匹配的样本,确定为噪声样本,并根据噪声样本的邻居样本构造一个新文本,对噪声样本的文本进行替换,得到跨模态正样本;将训练数据集中相似的图像,作为单模态正样本;根据跨模态正样本和单模态正样本,构建正样本数据集;按照不同的聚类,从正样本数据集中采样多个正样本作为一个训练批次的训练样本,训练样本用于训练视觉语言模型。
技术关键词
噪声样本 样本采样方法 邻居 文本 跨模态 视觉 数据 聚类 图像匹配 样本采样装置 语义 采样模块 处理器 存储器 编码 电子设备 频率
系统为您推荐了相关专利信息
1
基于AI的新媒体智能营销方法
智能营销方法 视觉焦点区域 文本情感倾向 媒体 指数
2
一种自动化测试管理方法、装置、设备及介质
自动化测试管理 仿真数据 指标 复杂度 编排技术
3
一种用于空天地立体化异构网络的智融协同传输方法
协同传输方法 李雅普诺夫函数 传输路径 异构 标志位
4
跨领域小样本异常检测方法、装置、电子设备及存储介质
异常检测方法 图像重建 语义 样本 文本
5
一种基于多轮迭代的隐私增强型智能搜索方法及系统
智能搜索方法 联邦学习技术 动态优先级排序 跨模态数据 语义向量
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号