Swin-MVGA网络多视图特征融合的三维模型分类

AITNT
正文
推荐专利
Swin-MVGA网络多视图特征融合的三维模型分类
申请号:CN202510569652
申请日期:2025-05-04
公开号:CN120495743A
公开日期:2025-08-15
类型:发明专利
摘要
本发明涉及一种在SwinTransformer的基础上,提出加入全局Multi‑head Self‑Attention(MHSA)模块的多视图三维模型分类方法(Swin Multi‑View Global Attention,Swin‑MVGA)。本发明首先对三维模型进行多角度投影,生成一个包含多个二维视图的视图集。利用Swin‑MVGA对每个二维视图进行处理,提取出具备全局表达能力的视觉特征。采用SIFT算法提取图像中的局部关键点信息,捕捉细节特征;另外,利用LBP算法获取图像的边缘和纹理特征。将这三种特征进行融合后,得到的二维视图融合特征能够同时反映出模型的全局结构和局部细节。将通过多层感知机(MLP)提取的多视图融合特征输入到Softmax转换为概率分布,设计均方根商特征法(Root Mean Quotient Feature Method,RMQF)从概率分布中提取代表性特征,最后将经过RMQF提取的代表性特征来确定三维模型的类别,从而实现准确的三维模型分类。本发明具有较好的三维模型分类效果,能更准确地解决三维模型分类问题。
技术关键词
三维模型分类方法 纹理特征 关键点 描述符 三维模型集 邻域 网络 梯度方向直方图 预测类别 融合特征提取 线性变换矩阵 LBP算法 LBP特征 像素 注意力 金字塔
系统为您推荐了相关专利信息
1
一种碰撞场景下驾驶员模仿方法、装置、存储介质和终端
姿态识别模型 微调单元 场景 图像 人体损伤评估
2
一种机器人的控制方法、系统
动态障碍物 多模态传感器 机器人运动轨迹 分布式模型预测控制 避障路径
3
一种基于鱼眼相机的卫星非视距信号检测与修正方法
鱼眼相机 修正方法 卫星导航数据 鱼眼图像 棋盘格标定板
4
一种服务器组件识别方法
服务器组件 图像识别模型 融合特征 识别方法 检测识别模块
5
分组点云驱动的臂手操作系统
去噪模型 机器人状态信息 操作系统 数据储存模块 点云特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号