一种基于半监督场景识别的图片分类管理方法

正文

推荐专利

申请号：CN202411700695

申请日期：2024-11-26

公开号：CN119649108B

公开日期：2025-11-28

类型：发明专利

摘要

本发明公开了一种基于半监督场景识别的图片分类管理方法，引入视觉‑语言跨模态模型，定义有标签图片集和无标签图片集作为模型训练集；提取图片视觉特征和图片文本标注的特征；抽取视觉特征图池化之后的嵌入作为图片样本的全局信息，将其输入到场景判别器中得到场景鉴别结果；输入视觉特征图池化前的嵌入并计算类别相关特征；利用图片数据集中类别的共现关系，将标签空间划分为若干簇；同时引入场景识别的辅助任务，利用标签中的共现信息将类别划分为不同的簇，输入图片全局特征来对场景进行判别，得到损失函数。本发明能够提升图片分类的速度与精度，同时提供了场景关键词检索功能，来帮助用户快速对指定图片进行检索定位。

技术关键词

图片分类管理方法视觉特征场景文本编码器标签图片集跨模态交叉注意力机制无标签样本无标签数据半监督学习矩阵分类器训练集代表

系统为您推荐了相关专利信息

场景显示方法、装置、电子设备和计算机可读存储介质

场景显示方法虚拟对象显示虚拟场景图形用户界面可读存储介质

场景重建高斯模型生成方法以及场景重建方法

训练图像序列图像采集装置模型生成方法锚点场景构建方法

语音合成方法、装置、电子设备、存储介质及产品

语音情感识别模型手语样本手势特征

一种网络自适应异步拜占庭共识系统和方法

节点共识系统网络同步器通道

内容自动生成方法、计算机设备、介质和系统

人工智能模型自动生成方法风格热点主题

一种基于半监督场景识别的图片分类管理方法

站点导航

APP 下载