基于大语言模型的物品检测方法、装置及电子设备

正文

推荐专利

申请号：CN202511098829

申请日期：2025-08-06

公开号：CN120953916A

公开日期：2025-11-14

类型：发明专利

摘要

本申请公开了一种基于大语言模型的物品检测方法、装置及电子设备，涉及人工智能领域和金融科技领域，其中，该方法包括：基于目标图像确定目标提示词，将目标图像和目标提示词输入至目标模型，目标模型为基于L个训练图像训练得到的视觉语言模型，每个训练图像对应一个伪标签和图像标注，伪标签用于表征通过大语言模型基于训练图像和图像标注生成的违规物品的信息，在目标模型检测到目标图像中存在目标提示词对应的违规物品的情况下，通过目标模型确定目标位置。本申请解决了现有技术中由于视觉语言模型的训练样本存在长尾分布，所导致的通过训练得到的模型对物品进行检测的准确度低的技术问题。

技术关键词

物品检测方法大语言模型图像标签场景特征文本编码器物品检测装置计算机程序产品视觉注意力机制金融跨模态电子设备物品特征术语处理器

系统为您推荐了相关专利信息

电池的焊接检测方法、电子设备以及存储介质

焊接检测方法紫外可见光电池数据焊接设备

一种冶金铸造桥式起重机倾倒钢渣控制方法及相关设备

铸造桥式起重机钢包倾斜角度控制冶金控制策略

3D生成模型的训练方法、装置、设备及存储介质

数据生成规则样本图像计算机程序产品

一种用于PolInSAR图像地物散射特性表征及建筑检测方法

建筑检测方法相干性极化相干矩阵聚类代表

虚拟数字人共情能力增强方法、装置、设备、介质及产品

深度学习算法语音情绪识别大语言模型数据采集单元意图识别模型

基于大语言模型的物品检测方法、装置及电子设备

站点导航

APP 下载