摘要
本发明涉及计算机技术领域,提供了一种生成式多模态检索模型的训练方法、检索方法及相关装置,该生成式多模态检索模型的训练方法包括:对样本指令进行演化并评分,得到指令评分数据集;根据指令评分数据集通过微调的方式对大语言模型进行训练,得到指令评分模型;基于结果奖励模型数据集通过微调的方式对大语言模型进行训练,得到结果奖励模型;采用近端策略优化算法根据指令评分模型和结果奖励模型对MLLM进行强化学习训练,得到生成式多模态检索模型。本发明所述方法通过指令演化和强化学习的结合优化提升文本‑图像跨模态检索模型的性能,进而提高了文本‑图像跨模态检索效率和准确率。
技术关键词
多模态
检索方法
令牌
指令
检索图像
非暂态计算机可读存储介质
序列
大语言模型
数据
策略
跨模态
样本
算法
检索装置
处理器
受限
训练装置
匹配模块
文本
系统为您推荐了相关专利信息
配电自动化终端自动化检测平台
神经网络模型
自定义参数
重叠面积
顶点
心音特征
智能诊断模型
超声数据
异常检测设备
特征提取模块
图像处理器
等离子体设备
识别气体
拍摄设备
非易失性计算机可读存储介质
远程认证方法
终端设备
人脸识别认证
计算机程序指令
数据