摘要
本发明公开了一种基于视觉语言模型和历史数据学习的可变形物体形状控制方法,既结合了视觉目标中微观像素层面的指导,又利用了语言目标中的信息进行宏观语义层次的任务规划和逻辑推理,最后利用视觉语言模型将两种模态的目标信息进行融合,使得视觉目标和语言目标相互促进、相互协同,保证了可变形物体形状控制任务的精确规划,利用黑箱优化算法进行在线参数估计,实现对物体形变状态的实时追踪和更新,参数化多边形模型这一几何表征将高维视觉观测数据压缩至低维参数空间,显著降低了可变形物体状态观测的维度,只保留与任务相关的关键状态信息。
技术关键词
形状控制方法
视觉
多边形
对称轴
参数
物体轮廓
序列
图像
指令
四边形
算法
数据压缩
代表
节点
计算方法
多模态
规划
标签
系统为您推荐了相关专利信息
数据生成方法
LED灯具
设计数据结构
数据结构设计
生成算法
输出反馈控制器
系统控制方法
转移概率矩阵
通道
开环系统
检测分析方法
多视角
交叉注意力机制
偏差
建筑物
乒乓球捡球机器人
车身
机械臂机构
运动电机
摩擦盘