Swin-MVGA网络多视图特征融合的三维模型分类

正文

推荐专利

申请号：CN202510569652

申请日期：2025-05-04

公开号：CN120495743A

公开日期：2025-08-15

类型：发明专利

摘要

本发明涉及一种在SwinTransformer的基础上，提出加入全局Multi‑head Self‑Attention(MHSA)模块的多视图三维模型分类方法(Swin Multi‑View Global Attention,Swin‑MVGA)。本发明首先对三维模型进行多角度投影，生成一个包含多个二维视图的视图集。利用Swin‑MVGA对每个二维视图进行处理，提取出具备全局表达能力的视觉特征。采用SIFT算法提取图像中的局部关键点信息，捕捉细节特征；另外，利用LBP算法获取图像的边缘和纹理特征。将这三种特征进行融合后，得到的二维视图融合特征能够同时反映出模型的全局结构和局部细节。将通过多层感知机(MLP)提取的多视图融合特征输入到Softmax转换为概率分布，设计均方根商特征法(Root Mean Quotient Feature Method,RMQF)从概率分布中提取代表性特征，最后将经过RMQF提取的代表性特征来确定三维模型的类别，从而实现准确的三维模型分类。本发明具有较好的三维模型分类效果，能更准确地解决三维模型分类问题。

技术关键词

三维模型分类方法纹理特征关键点描述符三维模型集邻域网络梯度方向直方图预测类别融合特征提取线性变换矩阵 LBP算法 LBP特征像素注意力金字塔

系统为您推荐了相关专利信息

一种碰撞场景下驾驶员模仿方法、装置、存储介质和终端

姿态识别模型微调单元场景图像人体损伤评估

一种机器人的控制方法、系统

动态障碍物多模态传感器机器人运动轨迹分布式模型预测控制避障路径

一种基于鱼眼相机的卫星非视距信号检测与修正方法

鱼眼相机修正方法卫星导航数据鱼眼图像棋盘格标定板

一种服务器组件识别方法

服务器组件图像识别模型融合特征识别方法检测识别模块

分组点云驱动的臂手操作系统

去噪模型机器人状态信息操作系统数据储存模块点云特征

Swin-MVGA网络多视图特征融合的三维模型分类

站点导航

APP 下载