基于视觉语言模型和历史数据学习的可变形物体形状控制方法

AITNT
正文
推荐专利
基于视觉语言模型和历史数据学习的可变形物体形状控制方法
申请号:CN202510293736
申请日期:2025-03-13
公开号:CN119820579B
公开日期:2025-06-13
类型:发明专利
摘要
本发明公开了一种基于视觉语言模型和历史数据学习的可变形物体形状控制方法,既结合了视觉目标中微观像素层面的指导,又利用了语言目标中的信息进行宏观语义层次的任务规划和逻辑推理,最后利用视觉语言模型将两种模态的目标信息进行融合,使得视觉目标和语言目标相互促进、相互协同,保证了可变形物体形状控制任务的精确规划,利用黑箱优化算法进行在线参数估计,实现对物体形变状态的实时追踪和更新,参数化多边形模型这一几何表征将高维视觉观测数据压缩至低维参数空间,显著降低了可变形物体状态观测的维度,只保留与任务相关的关键状态信息。
技术关键词
形状控制方法 视觉 多边形 对称轴 参数 物体轮廓 序列 图像 指令 四边形 算法 数据压缩 代表 节点 计算方法 多模态 规划 标签
系统为您推荐了相关专利信息
1
一种LED灯的灯光效果数据生成方法、装置、设备及介质
数据生成方法 LED灯具 设计数据结构 数据结构设计 生成算法
2
一种考虑衰减网络和输入饱和的Markov跳变系统控制方法
输出反馈控制器 系统控制方法 转移概率矩阵 通道 开环系统
3
一种促进仿生设计理解与推理的教学方法、系统及电子设备
教学方法 三元组 关键词 仿生功能 交互模型
4
一种智能建造过程三维建模与质量检测分析方法
检测分析方法 多视角 交叉注意力机制 偏差 建筑物
5
一种基于视觉识别的乒乓球捡球机器人
乒乓球捡球机器人 车身 机械臂机构 运动电机 摩擦盘
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号