模型训练方法、装置、设备、存储介质和产品

正文

推荐专利

申请号：CN202510306547

申请日期：2025-03-14

公开号：CN120218245A

公开日期：2025-06-27

类型：发明专利

摘要

本申请涉及一种模型训练方法、装置、设备、存储介质和产品。该方法包括：根据多模态数据转换得到的目标文本推理链，构建训练数据集；根据训练数据集，对预训练好的多模态大语言模型进行监督微调，得到基础推理模型；根据长思考的强化学习训练对基础推理模型进行优化处理，得到目标推理模型；该目标推理模型用于根据输入的多模态数据输出包含推理过程的目标答案。从而可以直接使用长文本约束进行强化学习，极大地提升训练效率；而采用长思考的强化学习训练，能够使模型在训练中较为轻易的学到正确的思维过程，以提升多模态大语言模型处理复杂视觉推理任务的推理能力，并在推理的过程中展示出正确的思维过程。

技术关键词

大语言模型文本多模态模型训练方法答案强化学习算法基础图像模型训练装置视觉推理数据处理装置数据处理方法格式计算机程序产品聚类处理器视觉特征计算机设备

系统为您推荐了相关专利信息

基于共同最优性的图片-文本匹配方法

文本匹配方法图片图像生成器编码器模块图文匹配技术

翻译文本质量评估方法、装置、计算机设备及存储介质

文本计算机设备编码语法特征评估装置

中医辅助诊疗方法及电子设备、计算机可读存储介质

辅助诊疗方法病历词向量模型术语可读存储介质

基于大数据的元宇宙用户行为分析闭环方法、系统和介质

闭环方法场景化数据大数据优化业务漏斗模型

一种宗教教学AR虚拟现实体验系统

虚拟现实体验系统文本理解长短期记忆网络教学融合深度学习模型

模型训练方法、装置、设备、存储介质和产品

站点导航

APP 下载