一种基于多级编码降低大模型多模态特征量的方法

正文

推荐专利

申请号：CN202510115607

申请日期：2025-01-24

公开号：CN119559477B

公开日期：2025-04-15

类型：发明专利

摘要

本发明公开了一种基于多级编码降低大模型多模态特征量的方法，涉及计算机视觉和深度学习领域，包括采集高分辨率图像并进行预处理，将预处理后的高分辨率图像进行特征提取和初步降维，获取初步压缩特征图，基于初步压缩特征图，构建多尺度特征金字塔，生成不同层次特征，对不同层次特征应用分层注意力机制，获取带有局部和全局注意力权重的特征图，将带有局部和全局注意力权重的特征图采用分层融合策略，生成多层级注意力优化特征，将多层级注意力优化特征使用图像重建处理，获取重建后的特征表示和图像。本发明在捕捉图像时保持对全局结构的关注，解决了多尺度特征融合不充分以及局部与全局注意力机制应用不平衡的问题，实现了更高效的特征表示。

技术关键词

多尺度特征金字塔多模态特征压缩特征分层注意力融合策略深度卷积神经网络层级图像重建编码上采样局部注意力机制分辨率卷积神经网络提取图像块多头注意力机制成分分析生成多尺度

系统为您推荐了相关专利信息

一种基于多尺度特征与跨层级特征交互的农作物害虫目标检测方法及系统

融合特征农作物害虫多尺度特征层级强化特征

基于时间感知分层注意力网络的序列推荐方法

序列推荐方法分层注意力矩阵兴趣时序特征

一种基于多模态融合的智慧大屏交互播控系统

智慧大屏播控系统 AI算法子模块多模态

一种应用于三屏笔记本电脑的智能问答与模型训练方法

模型训练方法笔记本电脑屏幕资源分配自动语音识别技术

一种自由搭配组合式电商运营用直播方法及设备

直播方法商品特征协同过滤算法推荐算法建立用户画像

一种基于多级编码降低大模型多模态特征量的方法

站点导航

APP 下载