摘要
本申请实施方式提供了一种商品图像的处理方法及相关装置。所述方法,包括:针对商品图像进行图像内容理解得出所述商品图像的主体词;其中,所述主体词用于描述所述商品图像中的主体商品;基于所述主体词构建主体图识别提示指令,调用多模态视觉模型,以指示所述多模态视觉模型从所述商品图像中识别得出所述主体商品在所述商品图像中的区域信息。可以一定程度上提升商品图像的处理效率。
技术关键词
多模态
生成指令
背景图
视觉
计算机程序产品
图像分割模型
计算机设备
可读存储介质
物体
大语言模型
处理器
信息处理
存储器
尺寸
模块
颜色
系统为您推荐了相关专利信息
路段
异常轨迹
地图匹配方法
维特比算法
空间索引技术
安全监控系统
直方图均衡化
环境传感器数据
图像增强单元
多模态
图形用户界面
虚拟对象
游戏场景
终端设备
能量存储