基于语言引导的长尾增量图像识别方法、系统及介质

正文

推荐专利

申请号：CN202510009027

申请日期：2025-01-03

公开号：CN120088797A

公开日期：2025-06-03

类型：发明专利

摘要

本发明公开了基于语言引导的长尾增量图像识别方法、系统及介质，方法为：构建长尾增量图像识别模型；获取多批次长尾分布训练数据；设计固定的语言模版并通过大语言模型根据每一批长尾分布训练数据中新类别图像的类别标签生成对应的类别文本描述；将多批次长尾分布训练数据及对应类别文本描述按批次输入长尾增量图像识别模型，采用两阶段训练方式进行训练，得到训练好的长尾增量图像识别模型；将待识别长尾分布数据输入训练好的长尾增量图像识别模型，得到识别结果。本发明通过引入语言先验信息，可以同时解决长尾类别增量学习场景下的新数据少样本类别过拟合和旧任务知识灾难性遗忘的问题，提高了模型的性能，增强了长尾增量图像识别的准确性。

技术关键词

图像识别模型图像识别方法特征协方差矩阵模态特征文本编码器标签语义视觉两阶段大语言模型模型训练模块类别增量学习网络数据获取模块编码向量学习方法

系统为您推荐了相关专利信息

一种非接触式血液光谱成像血压监测系统及方法

光学响应特征血压监测方法光谱成像血红蛋白非接触式

一种应用于垃圾箱的回收物处理方法、装置及电子设备

反射光谱数据垃圾箱多模态特征激光高精度称重传感器

基于多模态数据融合的工件质量实时检测方法、装置、设备、介质及产品

工件图像特征向量多模态特征融合多模态数据融合参数

一种双层塑料吹塑检测方法及系统

塑料板材超声波特征网格热力图多模态特征

一种基于动态缓存的零样本异常检测方法及系统

异常检测方法图像嵌入文本编码器图像编码器视觉特征

基于语言引导的长尾增量图像识别方法、系统及介质

站点导航

APP 下载