摘要
本发明涉及一种在SwinTransformer的基础上,提出加入全局Multi‑head Self‑Attention(MHSA)模块的多视图三维模型分类方法(Swin Multi‑View Global Attention,Swin‑MVGA)。本发明首先对三维模型进行多角度投影,生成一个包含多个二维视图的视图集。利用Swin‑MVGA对每个二维视图进行处理,提取出具备全局表达能力的视觉特征。采用SIFT算法提取图像中的局部关键点信息,捕捉细节特征;另外,利用LBP算法获取图像的边缘和纹理特征。将这三种特征进行融合后,得到的二维视图融合特征能够同时反映出模型的全局结构和局部细节。将通过多层感知机(MLP)提取的多视图融合特征输入到Softmax转换为概率分布,设计均方根商特征法(Root Mean Quotient Feature Method,RMQF)从概率分布中提取代表性特征,最后将经过RMQF提取的代表性特征来确定三维模型的类别,从而实现准确的三维模型分类。本发明具有较好的三维模型分类效果,能更准确地解决三维模型分类问题。
技术关键词
三维模型分类方法
纹理特征
关键点
描述符
三维模型集
邻域
网络
梯度方向直方图
预测类别
融合特征提取
线性变换矩阵
LBP算法
LBP特征
像素
注意力
金字塔
系统为您推荐了相关专利信息
动态障碍物
多模态传感器
机器人运动轨迹
分布式模型预测控制
避障路径
鱼眼相机
修正方法
卫星导航数据
鱼眼图像
棋盘格标定板
服务器组件
图像识别模型
融合特征
识别方法
检测识别模块
去噪模型
机器人状态信息
操作系统
数据储存模块
点云特征