摘要
本发明公开了一种基于多模态特征融合的语义分割方法、设备及介质,涉及图像语义分割技术领域,所述方法包括:将待测3D点云图像输入预先构建好的多模态特征融合模型,以生成语义分割结果;多模态特征融合模型的构建步骤包括:根据2D图像生成2D图像特征;根据3D点云图像生成3D点云特征;将2D图像特征及3D点云特征的尺寸分别进行变形处理;将3D点云图像进行球状投影及特征后处理以生成球状2D特征;将球状2D特征分别与变形后的2D图像特征及3D点云特征进行融合以生成2D融合特征及3D融合特征;根据2D融合特征生成2D图像预测结果并计算2D交叉熵损失;根据3D融合特征生成3D点云预测结果并计算3D交叉熵损失;对齐2D图像预测结果及3D点云预测结果以计算预测损失,对齐变形后的2D图像特征及3D点云特征以计算特征损失;计算基准损失;根据基准损失调整Poi nt Transformer V2模型以形成多模态特征融合模型。采用本发明,可提高农业机器人在复杂场景下的语义理解性能。
技术关键词
多模态特征融合
语义分割方法
融合特征
3D点云图像
球状
图像语义分割技术
知识蒸馏技术
语义分割模型
基准
学生
农业机器人
模型压缩
标签
元素
处理器
系统为您推荐了相关专利信息
新型卷积神经网络
光谱特征提取
融合特征
编码器
光谱分类方法
水平诊断方法
个性化教育
个性化学习技术
学生认知状态
教育数据挖掘
图像颜色特征提取
纺纱线
表征方法
空间特征提取
前馈神经网络