基于多模态数据处理的多目标商品识别方法、装置及系统

正文

推荐专利

申请号：CN202510728593

申请日期：2025-06-03

公开号：CN120236155B

公开日期：2025-09-02

类型：发明专利

摘要

本发明涉及智能售货技术领域，解决了现有技术中无法在多目标场景下准确地进行商品识别的问题，提供了一种基于多模态数据处理的多目标商品识别方法、装置及系统。该方法包括：获取商品交易场景下多帧实时图像；对实时图像进行预处理和标签信息提取，确定目标图像和商品标签对应的文字信息；对目标图像进行实例分割，确定商品位置信息；对目标图像进行特征提取，确定商品图像特征信息；根据预收集的智能售货场景下的多源私有化数据，对开源多模态视觉语言模型进行微调与优化处理，得到多模态大模型；将商品图像特征信息和文字信息输入多模态大模型中进行信息融合，确定商品目标识别结果。本发明能够在多目标场景下准确地进行商品识别。

技术关键词

商品图像特征商品识别方法多模态实时图像融合特征商品标签实例分割区域位置信息显著性检测模型实时视频融合图像特征样本计算机程序指令场景智能售货技术光学字符识别技术商品识别系统商品识别装置

系统为您推荐了相关专利信息

基于多模态数据融合分析的旅游目的地客流疏导方法

多模态数据融合 Attention机制变量关键字双向长短期记忆

一种面向第一人称视角的交互说话人检测方法

人检测方法音频编码器视觉音频特征视角

基于人工智能的囊泡运输路径预测系统

路径预测系统时间卷积网络囊泡多模态轨迹可视化

一种多模态水上救援机器人协同控制方法及相关装置

水上救援机器人协同控制方法声呐传感器多模态雷达传感器

多源异构数据的融合方法、装置、设备及存储介质

多源异构数据多通道卷积神经网络加权特征轨迹融合方法

基于多模态数据处理的多目标商品识别方法、装置及系统

站点导航

APP 下载