基于视觉大模型的高分辨率图像处理方法及相关系统

AITNT
正文
推荐专利
基于视觉大模型的高分辨率图像处理方法及相关系统
申请号:CN202510426200
申请日期:2025-04-07
公开号:CN120339566A
公开日期:2025-07-18
类型:发明专利
摘要
本发明属于图像处理领域,公开了基于视觉大模型的高分辨率图像处理方法及相关系统,本发明通过将图像分块并转码映射(得到第一特征图),将全图处理问题转化为对较小局部块的处理,有效减少直接对高分辨率整图进行全局自注意力计算所带来的计算量。本发明对第一特征图和后续特征进行层归一化处理,确保各层特征具有统一的均值和方差,有助于缓解梯度消失和内部协变量偏移,进而使训练过程更加稳定。本发明通过将第二特征图按预设尺寸划分为若干小块,在每个小块内进行局部自注意力计算,能够专注于局部区域的细节与语义关系,减少全局自注意力带来的高计算成本,同时保持局部信息的充分表达。
技术关键词
注意力 视觉 分块 矩阵 邻域 捕获特征 缩放参数 非线性 关系 图像分割 模块 数值 尺寸 指数 处理器 图像处理 存储器
系统为您推荐了相关专利信息
1
基于LWE的密文域可直读无损信息隐藏方法及系统
无损信息隐藏方法 明文 图像 冗余 信息隐藏系统
2
基于多波段图像融合的早期癌变风险预警方法及装置
多波段图像融合 风险预警方法 深度学习模型 像素点 光源
3
一种机器人抓取物体的方法、机器人及存储介质
机器人抓取物体 物体检测 节点 机器人控制技术 指令
4
一种神经系统影像分析方法和装置
影像分析方法 多模态数据融合 磁共振波谱成像 正电子发射断层扫描 功能磁共振成像
5
一种基于TF-IDF拼音向量模型的智能电话本搜索方法
拼音 搜索方法 字符 编辑 索引表
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号