基于强化学习与视觉语言模型的动态物体定位方法及系统

AITNT
正文
推荐专利
基于强化学习与视觉语言模型的动态物体定位方法及系统
申请号:CN202511002428
申请日期:2025-07-21
公开号:CN120913206A
公开日期:2025-11-07
类型:发明专利
摘要
本发明公开了一种基于强化学习与视觉语言模型的动态物体定位方法及系统,该动态物体定位方法包括以下步骤:S1:采集多模态传感器数据;S2:通过视觉语言模型提取所述多模态传感器数据中的视觉特征和文本特征;S3:构建强化学习策略网络,将所述视觉特征和所述文本特征进行融合得到融合后的多模态特征,基于所述多模态特征形成动态环境的状态空间和动作空间,以最大化奖励函数为目标优化强化学习策略网络,输出高维特征向量;S4:根据所述高维特征向量,生成物体的识别结果和位置信息;S5:将物体的识别结果和位置信息反馈给所述强化学习策略网络,以更新强化学习策略网络的参数,实现在线自适应优化。本发明大大提高了动态场景下的位姿估计精度。
技术关键词
动态物体定位 强化学习策略 多模态传感器 高维特征向量 视觉特征 多模态特征 网络 文本 特征提取模块 融合深度信息 数据采集模块 输出模块 三维点云信息 输出特征 表达式 图像
系统为您推荐了相关专利信息
1
一种基于人工智能的多模态文档解析系统
解析系统 表达式 文本 标签体系 自然语言
2
用于数控加工刀具的路径智能优化方法及系统
路径智能优化方法 动态力传感器 PID控制器 声光报警系统 数字孪生
3
基于物理约束嵌入的机器人控制方法、装置、设备及介质
机器人控制方法 物理 多模态特征 知识图谱构建 机器人控制装置
4
一种书法教学数字化系统及方法
书法教学 压力感应笔 数据输入模块 陀螺仪传感器 字帖库
5
一种核电厂房三维模型与辐射信息的配准融合方法
三维模型 近场通信标签 厂房 融合方法 多角度
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号