摘要
本发明公开了一种基于视觉语言模型和历史数据学习的可变形物体形状控制方法,既结合了视觉目标中微观像素层面的指导,又利用了语言目标中的信息进行宏观语义层次的任务规划和逻辑推理,最后利用视觉语言模型将两种模态的目标信息进行融合,使得视觉目标和语言目标相互促进、相互协同,保证了可变形物体形状控制任务的精确规划,利用黑箱优化算法进行在线参数估计,实现对物体形变状态的实时追踪和更新,参数化多边形模型这一几何表征将高维视觉观测数据压缩至低维参数空间,显著降低了可变形物体状态观测的维度,只保留与任务相关的关键状态信息。
技术关键词
形状控制方法
视觉
多边形
对称轴
参数
物体轮廓
序列
图像
指令
四边形
算法
数据压缩
代表
节点
计算方法
多模态
规划
标签
系统为您推荐了相关专利信息
土壤结构模型
坝体
稳定性监测方法
小型水库大坝
前端监测设备
状态空间模型
热处理炉
分区控制方法
子空间辨识方法
预测评估方法
自主水下机器人
轨迹跟踪控制方法
动态障碍物
海洋环境特征
自主水下航行
移动机器人视觉
交叉注意力机制
惯性传感器
融合方法
特征提取模型