摘要
本发明属于图像处理领域,公开了基于视觉大模型的高分辨率图像处理方法及相关系统,本发明通过将图像分块并转码映射(得到第一特征图),将全图处理问题转化为对较小局部块的处理,有效减少直接对高分辨率整图进行全局自注意力计算所带来的计算量。本发明对第一特征图和后续特征进行层归一化处理,确保各层特征具有统一的均值和方差,有助于缓解梯度消失和内部协变量偏移,进而使训练过程更加稳定。本发明通过将第二特征图按预设尺寸划分为若干小块,在每个小块内进行局部自注意力计算,能够专注于局部区域的细节与语义关系,减少全局自注意力带来的高计算成本,同时保持局部信息的充分表达。
技术关键词
注意力
视觉
分块
矩阵
邻域
捕获特征
缩放参数
非线性
关系
图像分割
模块
数值
尺寸
指数
处理器
图像处理
存储器
系统为您推荐了相关专利信息
多波段图像融合
风险预警方法
深度学习模型
像素点
光源
机器人抓取物体
物体检测
节点
机器人控制技术
指令
影像分析方法
多模态数据融合
磁共振波谱成像
正电子发射断层扫描
功能磁共振成像