基于优化算法的视觉-语言模型图文对精准评测数据构建方法

AITNT
正文
推荐专利
基于优化算法的视觉-语言模型图文对精准评测数据构建方法
申请号:CN202510867411
申请日期:2025-06-26
公开号:CN120783147A
公开日期:2025-10-14
类型:发明专利
摘要
本发明涉及一种基于优化算法的视觉‑语言模型图文对精准评测数据构建方法,该方法首先通过公开数据集筛选、实时设备采集或深度生成的方式,构建原始图片集合,依托预训练视觉‑语言模型反向生成初始提示词;结合构建的提示词模板,利用大语言模型对初始提示词进行优化,生成与图片高度匹配的提示词;随后,通过多维度评估函数对图文对数据进行优化处理,并对优化后的数据集进行人工校验,剔除低质量或重复的图文对,最终构建高质量的视觉‑语言模型评测数据集。本发明采用优化算法迭代提升图文对数据的匹配度和多样性,显著提高了评测数据的精准性和覆盖范围,可广泛应用于图像生成、视觉问答、跨模态检索等任务的模型性能评测。
技术关键词
数据构建方法 图文 视觉 图片 算法 语义角色标注方法 句式结构 事件识别 模板 大语言模型 同义词 跨模态 对象 图像编码 交叉注意力机制 文本特征向量 词嵌入模型
系统为您推荐了相关专利信息
1
一种单连杆机械臂的固定时间最优控制方法及系统
时间最优控制方法 单连杆 扩张状态观测器 非暂态计算机可读存储介质 强化学习算法
2
一种基于CAN网络电液阀升级方法、系统、介质及设备
CAN网络 电液阀 升级方法 阀块 数据
3
基于可行性时间窗和前向后向调整算法的自适应大邻域搜索方法
客户 节点 邻域搜索方法 车辆路径规划 仓库
4
素材管理方法、设备、素材管理系统以及存储介质
素材管理系统 版本更新 素材管理方法 算法 节点
5
无监督视差容忍太赫兹图像拼接方法及系统
图像拼接方法 掩膜 无监督 图像拼接系统 特征金字塔网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号