一种基于Transformer的视觉大模型训练系统

正文

推荐专利

申请号：CN202411666890

申请日期：2024-11-21

公开号：CN119169414B

公开日期：2025-05-16

类型：发明专利

摘要

本发明涉及模型训练技术领域，具体为一种基于Transformer的视觉大模型训练系统，系统包括：模糊区域选择模块基于输入图像数据，获取模糊区域和清晰区域的分布信息，根据图像的模糊区域和清晰区域进行权重分配，获取区域加权图，将区域加权图用于Transformer自注意力层中，生成权重调整后的注意力分布图。本发明中，通过对图像的亮度、颜色变化、对比度、边缘清晰度和纹理密集度等特征信息进行处理，动态区分模糊和清晰区域，并赋予清晰区域更高权重，使模型更加聚焦高信息量的区域，提升了在细节丰富场景中的分辨能力。基于相似度伪标签，通过标注样本与无标签样本之间的特征相似性关系，提高了无标签样本在特征学习过程中的准确性和效率。

技术关键词

模型训练系统无标签样本注意力矩阵图像生成多尺度视觉对比度模型训练技术亮度多尺度特征颜色生成标签特征值动态更新模块纹理

一种基于Transformer的视觉大模型训练系统

站点导航

APP 下载