摘要
本发明涉及大语言模型技术领域,公开一种多模态信息处理的条件偏好优化方法、系统、设备及介质,包括:根据用户输入数据,通过多模态大型语言模型,得到与问题关联图像对应的偏好回答数据对和与问题文本对应的偏好回答数据对;根据用户输入数据以及与问题关联图像对应的偏好回答数据对和与问题文本对应的偏好回答数据对,利用改进型条件偏好优化算法,得到与用户输入数据对应的最优回答,其中,改进型条件偏好优化算法包括直接偏好优化算法、多目标偏好优化算法以及自注意力奖励策略。本发明维护优选响应的质量,提升多模态大型语言模型在处理图像和文本等多模态输入时,能更准确地反映人类偏好,同时避免仅依赖语言信息而忽视图像信息的问题。
技术关键词
多模态
图像
文本
注意力
信息处理
策略
算法
子模块
大语言模型
数据获取模块
处理器
锚点
参数
存储器
电子设备
介质
关系
系统为您推荐了相关专利信息
深度强化学习模型
复杂度
智能仓储机器人
机器人状态信息
矩阵
图文匹配方法
文本
图像匹配
图像增强模型
特征窗口
实景地图
遥感影像数据
智能管理系统
图像识别技术
图像处理
特征提取网络
融合算法
输出特征
标记缺陷
吊取重物