一种基于位置反思思维链的多模态大模型训练方法

正文

推荐专利

申请号：CN202510981097

申请日期：2025-07-16

公开号：CN120875059A

公开日期：2025-10-31

类型：发明专利

摘要

本发明公开一种基于位置反思思维链的多模态大模型训练方法，包括以下步骤：S1、构建位置反思型思维链数据，通过区分思维链中数据提取与逻辑推理步骤，为前者关联图表视觉区域坐标，经绘图代码编辑、重渲染验证及图像分析技术自动化生成位置注释数据；S2、训练结构化推理模型，构建含视觉定位与逻辑推理的多类型指令数据集，采用多任务损失函数联合优化答案预测、位置定位及推理步骤生成，并通过边界框反思机制增强模型对图表元素的感知能力。本发明的方法有效解决现有模型依赖OCR导致的数值幻觉及思维链缺乏视觉交互问题，提升了图表理解准确性与思维链解释性，在主流基准上性能显著优于现有方法。

技术关键词

多任务损失函数模型训练方法图表图像分析技术数据答案坐标视觉标识符序列构建训练集位置验证样本多模态计算机程序产品机制编辑教师指令

系统为您推荐了相关专利信息

一种输电导线弧垂测量方法、装置及计算机程序产品

激光点云数据输电导线弧垂多模态特征融合注意力机制计算机程序产品

一种基于多窗口累积和算法与一维残差网络的电动车充电检测算法

多窗口窗口检测算法负荷识别技术残差网络模型

语义和句法融合的电力系统威胁实体关系提取方法及系统

实体关系提取方法动作关系新型电力系统语义角色标注实体关系数据

一种基于云原生的水利模型资源调度方法、设备及介质

水利模型资源调度方法轻量级容器数据采集程序队列

基于模型的道路估计

车道车辆运动数据道路特征路径规划功能车载传感器

一种基于位置反思思维链的多模态大模型训练方法

站点导航

APP 下载