基于大语言模型的物品检测方法、装置及电子设备

AITNT
正文
推荐专利
基于大语言模型的物品检测方法、装置及电子设备
申请号:CN202511098829
申请日期:2025-08-06
公开号:CN120953916A
公开日期:2025-11-14
类型:发明专利
摘要
本申请公开了一种基于大语言模型的物品检测方法、装置及电子设备,涉及人工智能领域和金融科技领域,其中,该方法包括:基于目标图像确定目标提示词,将目标图像和目标提示词输入至目标模型,目标模型为基于L个训练图像训练得到的视觉语言模型,每个训练图像对应一个伪标签和图像标注,伪标签用于表征通过大语言模型基于训练图像和图像标注生成的违规物品的信息,在目标模型检测到目标图像中存在目标提示词对应的违规物品的情况下,通过目标模型确定目标位置。本申请解决了现有技术中由于视觉语言模型的训练样本存在长尾分布,所导致的通过训练得到的模型对物品进行检测的准确度低的技术问题。
技术关键词
物品检测方法 大语言模型 图像 标签 场景特征 文本编码器 物品检测装置 计算机程序产品 视觉 注意力机制 金融 跨模态 电子设备 物品特征 术语 处理器
系统为您推荐了相关专利信息
1
电池的焊接检测方法、电子设备以及存储介质
焊接检测方法 紫外可见光 电池 数据 焊接设备
2
一种冶金铸造桥式起重机倾倒钢渣控制方法及相关设备
铸造桥式起重机 钢包 倾斜角度控制 冶金 控制策略
3
3D生成模型的训练方法、装置、设备及存储介质
数据 生成规则 样本 图像 计算机程序产品
4
一种用于PolInSAR图像地物散射特性表征及建筑检测方法
建筑检测方法 相干性 极化相干矩阵 聚类 代表
5
虚拟数字人共情能力增强方法、装置、设备、介质及产品
深度学习算法 语音情绪识别 大语言模型 数据采集单元 意图识别模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号