一种基于局部令牌语义挖掘的长尾参数高效微调方法

AITNT
正文
推荐专利
一种基于局部令牌语义挖掘的长尾参数高效微调方法
申请号:CN202410707319
申请日期:2024-06-03
公开号:CN118644712A
公开日期:2024-09-13
类型:发明专利
摘要
本发明提供了一种基于局部令牌语义挖掘的长尾参数高效微调方法。所述方法包括:采用预训练的序列化视觉编码器初始化图像特征提取模型,并使用相应的预训练的文本编码器提取类别文本特征对分类器权重进行初始化;然后对图像进行序列化,使用图像特征提取模型和参数高效微调模块提取序列化图像特征;通过语义聚合函数,挖掘并聚合局部序列化特征中局部令牌所包含的语义信息,用以增强序列化特征中的类别令牌特征,获得增强类别令牌特征;然后采用概率控制样本补充策略,灵活地利用增强类别令牌特征对各类别样本进行补充,从而缓解长尾分布问题;最后通过图像分类损失和令牌特征一致性损失监督参数高效微调模块、语义聚合函数和分类器的学习。本发明提出的框架能够应对预训练模型用于下游长尾图像分类任务时,所遇到的的信息不平衡和缺失问题。此框架能够大幅提升基于预训练序列化模型的多种参数高效微调方法及多种分类损失函数在长尾分布场景中的图像分类性能,具有较强的实用性。
技术关键词
令牌 微调方法 序列化特征 分类器 图像特征提取模型 样本 参数 序列特征 语义特征 文本编码器 图像分类模型 网络 多层感知器 模块 预训练模型 嵌入特征 编码特征
系统为您推荐了相关专利信息
1
基于多维层次语义蒸馏的深度学习模型压缩方法
教师 学生 蒸馏 皮尔逊相关系数 深度学习模型压缩
2
小波驱动的物理可解释网络的变转速轴承故障诊断方法
轴承故障诊断方法 搜索算法 傅里叶变换处理 频率 网络
3
基于大语言模型的行业舆情分析智能体构建方法及系统
体构建方法 大语言模型 专业知识库 分布式爬虫 图谱
4
一种结构材料腐蚀损伤跨尺度评价方法与系统
裂纹尺寸 评价指标体系 生成结构 疲劳寿命预测 腐蚀疲劳裂纹扩展
5
一种基于BERT、ViT和宽度学习的图文多模态情绪原因对识别方法
多模态情绪 文本 识别方法 编码器 融合特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号