摘要
本发明公开了一种面向机器人的物品识别与抓取系统及方法,属于人工智能技术领域,包括多源数据输入模块、图像识别模块、语义生成模块、任务导向评估模块以及视觉反馈模块,其中,多源数据输入模块包括获得目标3D点云数据的RGB‑D相机以及用于接收自然语言指令FI的自然语言指令接口;图像识别模块包括双流卷积神经网络和改进的Transformer网络;语义生成模块包括大语言模型LLM;任务导向评估模块包括面向任务的抓取评估器TGE和点云编码器;视觉反馈模块用于在抓取任务结束后判断是否抓取成功,本发明能够精确识别目标物体,优化机械臂对目标物体的抓取性能。
技术关键词
图像识别模块
自然语言
双流卷积神经网络
抓取方法
数据输入模块
深度图像编码方法
模态特征
大语言模型
3D点云数据
抓取物体
特征加权融合
抓取系统
语言编码器
多头注意力机制
语义
指令
机器人夹具
系统为您推荐了相关专利信息
文档版面分析方法
扫描文档图像
分支
多尺度信息
编码器特征
数据挖掘方法
卷积神经网络模型
车辆传感器数据
数据标签
音频
智能体交互
医疗知识图谱
信息问答方法
语义向量
医学
历史故障数据
运维
中央处理器执行
文本
生成自然语言