一种视觉Transformer模型设计方法、装置、存储介质和程序产品

正文

推荐专利

申请号：CN202411038198

申请日期：2024-07-30

公开号：CN118840414B

公开日期：2025-04-29

类型：发明专利

摘要

本发明提供一种视觉Transformer模型设计方法、装置、存储介质和程序产品，其中，方法包括：设定最小形变图像的大小和最小区域块的大小；根据原图的宽高，得到原图的长边与短边之比取整的值，确定形变目标图像的一边长和待划分区域块的一边长；根据原图的长边与短边之比取整的值，计算出形变目标图像的宽高和待划分区域块的宽高；根据形变目标图像的宽高和待划分区域块的宽高，对图像进行形变和划分，得到若干区域块，送入Transformer结构中。将每个区域块划分成若干方块，对所述若干方块进行编码，得到每个区域块特征；整合所有的区域块特征，送入Transformer结构中进行训练。本发明可以在较少形变情况下提取更符合原始图像的特征信息。

技术关键词

模型设计方法图像视觉多头注意力机制计算机装置计算机程序产品处理器指令编码可读存储介质存储器

系统为您推荐了相关专利信息

一种车载设备数据备份处理装置与方法

车载设备振动传感器视频帧异常事件车辆

一种用于多功能天车换极的CV数据标注方法

数据标注方法归一化方法图像关键帧槽盖板

基于智能终端的拍照AI消除处理方法、装置及终端

拍照功能画面视频检测智能终端非临时性计算机可读存储介质

小样本图像分类方法、设备及介质

多头注意力机制图像分类方法参数样本模块

一种自动点胶工作站及使用方法

协作机器人视觉机械手工作站按压机械手相机镜头组件

一种视觉Transformer模型设计方法、装置、存储介质和程序产品

站点导航

APP 下载