基于语言引导的长尾增量图像识别方法、系统及介质

AITNT
正文
推荐专利
基于语言引导的长尾增量图像识别方法、系统及介质
申请号:CN202510009027
申请日期:2025-01-03
公开号:CN120088797A
公开日期:2025-06-03
类型:发明专利
摘要
本发明公开了基于语言引导的长尾增量图像识别方法、系统及介质,方法为:构建长尾增量图像识别模型;获取多批次长尾分布训练数据;设计固定的语言模版并通过大语言模型根据每一批长尾分布训练数据中新类别图像的类别标签生成对应的类别文本描述;将多批次长尾分布训练数据及对应类别文本描述按批次输入长尾增量图像识别模型,采用两阶段训练方式进行训练,得到训练好的长尾增量图像识别模型;将待识别长尾分布数据输入训练好的长尾增量图像识别模型,得到识别结果。本发明通过引入语言先验信息,可以同时解决长尾类别增量学习场景下的新数据少样本类别过拟合和旧任务知识灾难性遗忘的问题,提高了模型的性能,增强了长尾增量图像识别的准确性。
技术关键词
图像识别模型 图像识别方法 特征协方差矩阵 模态特征 文本编码器 标签 语义 视觉 两阶段 大语言模型 模型训练模块 类别增量学习 网络 数据获取模块 编码向量 学习方法
系统为您推荐了相关专利信息
1
一种非接触式血液光谱成像血压监测系统及方法
光学响应特征 血压监测方法 光谱成像 血红蛋白 非接触式
2
一种应用于垃圾箱的回收物处理方法、装置及电子设备
反射光谱数据 垃圾箱 多模态特征 激光 高精度称重传感器
3
基于多模态数据融合的工件质量实时检测方法、装置、设备、介质及产品
工件 图像特征向量 多模态特征融合 多模态数据融合 参数
4
一种双层塑料吹塑检测方法及系统
塑料板材 超声波特征 网格 热力图 多模态特征
5
一种基于动态缓存的零样本异常检测方法及系统
异常检测方法 图像嵌入 文本编码器 图像编码器 视觉特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号