基于视觉大模型的高分辨率图像处理方法及相关系统

正文

推荐专利

申请号：CN202510426200

申请日期：2025-04-07

公开号：CN120339566A

公开日期：2025-07-18

类型：发明专利

摘要

本发明属于图像处理领域，公开了基于视觉大模型的高分辨率图像处理方法及相关系统，本发明通过将图像分块并转码映射（得到第一特征图），将全图处理问题转化为对较小局部块的处理，有效减少直接对高分辨率整图进行全局自注意力计算所带来的计算量。本发明对第一特征图和后续特征进行层归一化处理，确保各层特征具有统一的均值和方差，有助于缓解梯度消失和内部协变量偏移，进而使训练过程更加稳定。本发明通过将第二特征图按预设尺寸划分为若干小块，在每个小块内进行局部自注意力计算，能够专注于局部区域的细节与语义关系，减少全局自注意力带来的高计算成本，同时保持局部信息的充分表达。

技术关键词

注意力视觉分块矩阵邻域捕获特征缩放参数非线性关系图像分割模块数值尺寸指数处理器图像处理存储器

系统为您推荐了相关专利信息

基于LWE的密文域可直读无损信息隐藏方法及系统

无损信息隐藏方法明文图像冗余信息隐藏系统

基于多波段图像融合的早期癌变风险预警方法及装置

多波段图像融合风险预警方法深度学习模型像素点光源

一种机器人抓取物体的方法、机器人及存储介质

机器人抓取物体物体检测节点机器人控制技术指令

一种神经系统影像分析方法和装置

影像分析方法多模态数据融合磁共振波谱成像正电子发射断层扫描功能磁共振成像

一种基于TF-IDF拼音向量模型的智能电话本搜索方法

拼音搜索方法字符编辑索引表

基于视觉大模型的高分辨率图像处理方法及相关系统

站点导航

APP 下载