摘要
本申请提供的模型物理常识理解能力强化方法、装置、介质及相关设备,在模型强化时,先基于预设的物理异常规则和正常图像合成物理违规图像;然后根据物理违规图像构建得到微调训练集,以及根据正常图像和物理违规图像构建得到优化训练集,从而可以为模型的不同训练阶段提供不同的训练侧重点;例如,基于微调训练集,采用低秩适应微调方法对初始视觉语言模型进行物理常识概念注入,这样得到的中间视觉语言模型可以快速精准学得视觉物理异常的核心概念并将其与视觉证据关联;基于优化训练集,采用组相对策略优化算法对中间视觉语言模型进行物理常识推理能力优化,这样得到的目标视觉语言模型可以有效学习物理因果性,进而提升对物理常识的理解能力。
技术关键词
图像生成模型
强化方法
物理
训练集
微调方法
文本
计算机可读指令
视觉
概念
强化装置
策略
处理器
算法
计算机设备
模块
存储器
标签
介质
参数
系统为您推荐了相关专利信息
样本
梯度下降算法
模型训练方法
模型训练模块
模型训练装置
地震数据去噪方法
去噪模型
条件生成对抗网络
训练集
小波域
决策树模型
自动化生成方法
训练样本数据
变量
策略