一种基于视觉和语言模型的可形变物体操纵方法和装置

AITNT
正文
推荐专利
一种基于视觉和语言模型的可形变物体操纵方法和装置
申请号:CN202411640054
申请日期:2024-11-18
公开号:CN119501933A
公开日期:2025-02-25
类型:发明专利
摘要
本发明涉及一种基于视觉和语言模型的可形变物体操纵方法和装置,方法包括:对可形变物体搭建操作环境,该操作环境包括用于采集可形变物体视觉数据的摄像头和用于操纵可形变物体的机械臂;在操作环境下对可形变物体进行视觉信息捕捉,得到图像数据,并记录对应的语言指令;通过语言模型根据语言指令,提取出关键动作和目标对象,生成操作指令;通过视觉处理模型根据图像数据提取出空间特征;将空间特征和操作指令融合,通过机器学习算法,生成最终的操作策略;将操作策略转化为机械臂的执行指令,以操纵可形变物体;与现有技术相比,本发明显著提高了机器人处理柔性物体的精度与效率,为智能制造、家居和服务等领域的应用提供了有效的技术支持。
技术关键词
视觉 机器学习算法 深度强化学习算法 物体操纵装置 策略 指令 机械臂 图像 数据 监控机械 关节 平台 自然语言 对象 样本 表达式 机器人 家居
系统为您推荐了相关专利信息
1
面向卫生健康与疾病预防诊断的大数据分析系统
大数据分析系统 卫生健康 数据采集模块 数据处理模块 数据存储模块
2
变流器跟-构网融合控制的多工况自适应优化方法及装置
变流器 状态空间模型 工况 变量 电力系统控制技术
3
一种应用于公路工程的路面缺陷视觉检测方法及装置
视觉检测方法 路面缺陷 双向边缘 滑动窗口 边缘检测
4
基于VR技术的画作交互式展览系统
展览系统 交互网络 图谱 真实感 语义特征
5
一种基于不平衡多标记学习的心电图分类及其可解释性方法
缩放方法 多标记学习 心电图分类方法 数据 疾病
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号