一种多模态奖励模型的训练方法、系统及问答方法

正文

推荐专利

申请号：CN202510780747

申请日期：2025-06-12

公开号：CN120744111A

公开日期：2025-10-03

类型：发明专利

摘要

本发明涉及人工智能技术领域，尤其是指一种多模态奖励模型的训练方法、系统及基于多模态大模型的问答方法，包括：根据原始文本偏好数据生成文本评估思维链数据集，再利用多模态大模型将文本评估思维链数据集和多模态原始偏好数据集中不同模态的数据进行对齐，构建初始多模态数据集；以初始多模态数据集微调多模态大模型，以激发多模态大模型的跨模态泛化能力，再利用微调后的跨模态判断模型生成全模态偏好数据集。本发明利用全模态偏好数据集训练得到的奖励模型不仅能够对不同模态下的生成结果进行细致、合理的偏好判断，还能生成具备因果逻辑的评估过程。

技术关键词

多模态文本数据样本模板跨模态问答方法大语言模型标签模型训练模块人工智能技术训练系统音频逻辑视频算法网络图像参数

系统为您推荐了相关专利信息

一种多模态弱纹理遥感图像匹配方法及系统

遥感图像匹配方法多模态纹理描述符面片

一种用于表面活性剂的定性定量检测方法

定性定量检测方法表面活性剂信号识别算法参数生成特征

一种机载设备监控系统

机载设备 RFID读写天线传输模块数据转换模块主控模块

一种电力保障区域的停电处理方法、装置、设备及介质

风险评估模型高精度时间同步方法历史运行数据预警终端高速数据采集设备

视频切片方法和装置、电子设备及存储介质

视频切片方法 GOP图像组视频帧人工智能视频电子设备

一种多模态奖励模型的训练方法、系统及问答方法

站点导航

APP 下载