摘要
本申请提供基于大模型和机器人的零售方法、系统、装置和介质,涉及智慧零售技术领域,方法包括:采用深度相机,拍摄获得零售场景的彩色图像和深度信息;采用大模型,解析用户输入的多模态信息,获得目标商品的属性信息;利用深度学习模型生成二维候选框并计算分类结果,再结合深度信息映射至三维坐标系获取定位坐标,进行三维分割和特征分析以优化分类精度,最终融合二维与三维分类结果确定目标商品,并根据定位坐标,控制机器人精准抓取目标商品完成结算。本申请有效提升了零售场景中商品识别的准确性和空间定位的精确度,有效解决了单一维度分类不准的问题,并增强了对复杂零售场景的适应性,减少了人工干预,提高了零售业务的工作效率。
技术关键词
二维候选框
零售方法
物体
点云
深度学习模型
彩色图像
深度相机
多维特征向量
零售装置
机器人抓取
坐标系
智慧零售技术
机器学习模型
抓取模块
数据获取模块
抓取装置
支持向量机模型
多模态信息
系统为您推荐了相关专利信息
车载毫米波雷达
校准
安装误差
多项式
多传感器融合
截面轮廓
三维模型
三维建模方法
神经网络模型
曲线特征
表面缺陷检测系统
多模态数据采集
表面缺陷检测方法
钣金件
三维轮廓仪
激光雷达点云数据
相机图像数据
装卸设备
协同定位方法
多传感器融合