视觉语言动作模型的强化微调方法、装置、设备及介质

正文

推荐专利

申请号：CN202510826694

申请日期：2025-06-19

公开号：CN120656039A

公开日期：2025-09-16

类型：发明专利

摘要

本发明涉及人工智能领域，可应用于金融科技、医疗健康等业务系统平台中，公开了视觉语言动作模型的强化微调方法、装置、设备及介质，包括：加载待微调的视觉语言动作模型，视觉语言动作模型用于根据视觉信息和语言指令操作机器人执行相应的动作任务；采集多条演示数据，通过演示数据对视觉语言动作模型进行离线强化学习，获得离线微调模型；将离线微调模型部署到实际环境中，控制机器人按任务重置策略与环境进行交互，获得探索轨迹与环境反馈；根据探索轨迹、环境反馈与演示数据对离线微调模型进行在线强化学习，获得微调后的视觉语言动作模型。通过分阶段的强化微调以及任务重置策略实现协同的模型微调，提高微调效果以确保机器人运行的可靠性。

技术关键词

离线微调方法视觉轨迹非易失性计算机可读存储介质在线机器人计算机可执行指令数据权重策略序列动作策略医疗健康微调装置处理器通信业务系统计算机设备

系统为您推荐了相关专利信息

车辆轨迹热力图显示方法、装置、设备及可读存储介质

热力图显示方法 K均值聚类算法轨迹坐标车辆

资源分配方法、装置、设备及介质

神经网络算法计算机执行指令策略资源分配方法资源分配装置

位置精度评估方法、装置、设备、车辆、存储介质及产品

精度评估方法数据场景类别轨迹特征视觉特征信息

一种基于物联网的消防信息管理系统及方法

消防信息管理系统视频流可见光图像区域识别分析场地环境

一种端头垂直车位的自动泊车方法、系统、设备及介质

自动泊车方法车辆端头圆心终点

视觉语言动作模型的强化微调方法、装置、设备及介质

站点导航

APP 下载