摘要
本发明涉及大语言模型技术领域,公开一种多模态信息处理的条件偏好优化方法、系统、设备及介质,包括:根据用户输入数据,通过多模态大型语言模型,得到与问题关联图像对应的偏好回答数据对和与问题文本对应的偏好回答数据对;根据用户输入数据以及与问题关联图像对应的偏好回答数据对和与问题文本对应的偏好回答数据对,利用改进型条件偏好优化算法,得到与用户输入数据对应的最优回答,其中,改进型条件偏好优化算法包括直接偏好优化算法、多目标偏好优化算法以及自注意力奖励策略。本发明维护优选响应的质量,提升多模态大型语言模型在处理图像和文本等多模态输入时,能更准确地反映人类偏好,同时避免仅依赖语言信息而忽视图像信息的问题。
技术关键词
多模态
图像
文本
注意力
信息处理
策略
算法
子模块
大语言模型
数据获取模块
处理器
锚点
参数
存储器
电子设备
介质
关系
系统为您推荐了相关专利信息
医学影像数据
肿瘤生长预测
多层卷积神经网络
注意力机制
加权特征
逻辑推理方法
自然语言文本
大语言模型
表达式
智能机器人