摘要
本发明公开了基于语言引导的长尾增量图像识别方法、系统及介质,方法为:构建长尾增量图像识别模型;获取多批次长尾分布训练数据;设计固定的语言模版并通过大语言模型根据每一批长尾分布训练数据中新类别图像的类别标签生成对应的类别文本描述;将多批次长尾分布训练数据及对应类别文本描述按批次输入长尾增量图像识别模型,采用两阶段训练方式进行训练,得到训练好的长尾增量图像识别模型;将待识别长尾分布数据输入训练好的长尾增量图像识别模型,得到识别结果。本发明通过引入语言先验信息,可以同时解决长尾类别增量学习场景下的新数据少样本类别过拟合和旧任务知识灾难性遗忘的问题,提高了模型的性能,增强了长尾增量图像识别的准确性。
技术关键词
图像识别模型
图像识别方法
特征协方差矩阵
模态特征
文本编码器
标签
语义
视觉
两阶段
大语言模型
模型训练模块
类别增量学习
网络
数据获取模块
编码向量
学习方法
系统为您推荐了相关专利信息
光学响应特征
血压监测方法
光谱成像
血红蛋白
非接触式
反射光谱数据
垃圾箱
多模态特征
激光
高精度称重传感器
工件
图像特征向量
多模态特征融合
多模态数据融合
参数
异常检测方法
图像嵌入
文本编码器
图像编码器
视觉特征