摘要
本申请公开了基于混合训练的视觉推理调整方法及电子设备,属于数据处理技术领域,该方法包括:确定视觉推理数据集,基于所述视觉推理数据集激活视觉语言模型的监督微调推理能力,使得所述视觉语言模型能够完成目标推理过程;利用组相对策略优化算法优化所述视觉语言模型的所述监督微调推理能力。本申请减少了对大量标注数据的依赖,提升了数据效率;通过强化学习的动态优化机制,能够更好地适应跨领域任务,显著提升了模型的泛化能力。
技术关键词
视觉推理
答案
令牌
电子设备
格式
策略
数据处理技术
序列
图像
处理器
算法
存储器
机制
参数
模板
样本
动态
系统为您推荐了相关专利信息
码垛单元
距离信息
飞行器
计算机程序指令
码垛区域