基于强化学习与视觉语言模型的动态物体定位方法及系统

正文

推荐专利

申请号：CN202511002428

申请日期：2025-07-21

公开号：CN120913206A

公开日期：2025-11-07

类型：发明专利

摘要

本发明公开了一种基于强化学习与视觉语言模型的动态物体定位方法及系统，该动态物体定位方法包括以下步骤：S1：采集多模态传感器数据；S2：通过视觉语言模型提取所述多模态传感器数据中的视觉特征和文本特征；S3：构建强化学习策略网络，将所述视觉特征和所述文本特征进行融合得到融合后的多模态特征，基于所述多模态特征形成动态环境的状态空间和动作空间，以最大化奖励函数为目标优化强化学习策略网络，输出高维特征向量；S4：根据所述高维特征向量，生成物体的识别结果和位置信息；S5：将物体的识别结果和位置信息反馈给所述强化学习策略网络，以更新强化学习策略网络的参数，实现在线自适应优化。本发明大大提高了动态场景下的位姿估计精度。

技术关键词

动态物体定位强化学习策略多模态传感器高维特征向量视觉特征多模态特征网络文本特征提取模块融合深度信息数据采集模块输出模块三维点云信息输出特征表达式图像

系统为您推荐了相关专利信息

一种基于人工智能的多模态文档解析系统

解析系统表达式文本标签体系自然语言

用于数控加工刀具的路径智能优化方法及系统

路径智能优化方法动态力传感器 PID控制器声光报警系统数字孪生

基于物理约束嵌入的机器人控制方法、装置、设备及介质

机器人控制方法物理多模态特征知识图谱构建机器人控制装置

一种书法教学数字化系统及方法

书法教学压力感应笔数据输入模块陀螺仪传感器字帖库

一种核电厂房三维模型与辐射信息的配准融合方法

三维模型近场通信标签厂房融合方法多角度

基于强化学习与视觉语言模型的动态物体定位方法及系统

站点导航

APP 下载