一种预训练图像特征提取模型的训练方法及相关装置

正文

推荐专利

申请号：CN202511021913

申请日期：2025-07-23

公开号：CN120877302A

公开日期：2025-10-31

类型：发明专利

摘要

本申请公开了一种预训练图像特征提取模型的训练方法及相关装置。首先可以先获取包含多张样本图像的预训练数据集，这些样本图像分为两类：第一目标图像和第二目标图像。第一目标图像配备了基于SAM模型识别的区域识别框及对应的数值或符号形式的类别标签；第二目标图像则带有利用OCR模型标注的区域识别框及与视觉内容一致的文字描述。随后，采用ViT结构作为初始模型，并引入掩码机制，将模型提取的全局特征通过注意力加权公式转换为多个对应区域的局部特征。最后，通过结合所有局部特征与其对应的多维局部标签设计损失函数，对初始模型进行端到端参数优化，训练出能够同时捕捉细粒度视觉信息和文本信息的预训练图像特征提取模型。

技术关键词

图像特征提取模型样本文本识别标签训练集光学字符识别文本信息提取机制特征提取单元视觉可读存储介质终端设备数据对象检测聚类符号训练装置参数度函数

系统为您推荐了相关专利信息

建立双重约束的半监督分类方法

监督分类方法样本初始聚类中心编码器训练少量标注数据

一种X射线图像的缺陷识别方法、装置、设备及存储介质

缺陷识别方法深度学习模型缺陷预测标注工具图像增强

一种基于大模型的数据脱敏方法、装置、设备及存储介质

数据脱敏方法脱敏策略文件头信息数据管理方法句式结构

一种基于复合模型软投票集成的光伏阵列故障诊断方法

集成算法光伏阵列故障数据曲线超参数

一种基于自监督学习的轻量化卫星故障诊断方法

高斯混合模型卫星故障诊断方法卫星遥测数据协方差矩阵计算方法

一种预训练图像特征提取模型的训练方法及相关装置

站点导航

APP 下载