基于视觉强化学习的模型训练方法、装置、设备及介质

正文

推荐专利

申请号：CN202511038413

申请日期：2025-07-28

公开号：CN120543954B

公开日期：2025-09-23

类型：发明专利

摘要

本申请实施例提供了一种基于视觉强化学习的模型训练方法、装置、设备及介质。包括：获取样本图像帧及语义类别信息，将语义类别信息输入视觉大语言模型，得到第一卷积核参数，及将样本图像帧输入第一特征卷积核得到第一特征热力图；通过预设视觉强化学习模型得到样本图像帧的第二卷积核参数和第二特征热力图；基于第一卷积核参数与第二卷积核参数构建第一蒸馏损失，及基于第一特征热力图与第二特征热力图构建第二蒸馏损失；通过样本动作数据和样本状态数据预测和计算，构建自监督损失和目标策略损失；基于第一蒸馏损失、第二蒸馏损失、自监督损失和目标策略损失，对预设视觉强化学习模型进行参数调节，得到目标视觉强化学习模型。

技术关键词

强化学习模型样本模型训练方法热力图图像视觉数据策略大语言模型蒸馏解码器参数语义模型训练装置计算机设备网络文本模块处理器可读存储介质

系统为您推荐了相关专利信息

一种基于红外气体成像的VOCs气体泄漏检测装置和方法

气体泄漏检测方法成像组件激光测距组件气体泄漏检测装置红外探测器

基于改进的YOLOv5的无人机目标检测方法及系统、设备、介质

卷积模块无人机注意力机制图像语义特征

一种多语言文本分类的去偏方法

多语言模块文本特征加权数据分类技术文本分类模型

一种基于图像和文本离散化表示与字典对齐的视觉问答方法

视觉问答方法字典语言编码器图文文本生成图像

三维扫描方法、三维扫描装置以及三维扫描系统

纹理三维扫描方法贴纸待测物体三维扫描装置

基于视觉强化学习的模型训练方法、装置、设备及介质

站点导航

APP 下载