摘要
一种基于多原型学习的场景语义信息提取方法,包括以下步骤;步骤(1):对输入图像进行预处理;步骤(2):Backbone参数更新,将预处理后的图像提取特征;步骤(3):在每一类的稠密特征内进行在线聚类,为每个类别构建多个原型;步骤(4):将步骤(3)中每个类别的多个原型进行收集完成语义知识库的构建;步骤(5):对于输入图像中的每个像素,将其特征表示与语义知识库中的原型进行匹配,找到最相似的原型,最近原型匹配的结果将用于场景语义提取,步骤(6):对输出的逐像素语义标签进行重要性评估的后处理,最终得到整个场景的语义信息。本发明中每个像素的预测可以直观地理解为嵌入空间中与其最近原型中心的类别,增强了模型的可解释性。
技术关键词
语义信息提取方法
原型
语义知识库
像素
基元
图像提取特征
场景
语义标签
稠密特征
特征提取器
网络
在线
加权直方图
聚类
深度学习框架
参数
样本
定义
系统为您推荐了相关专利信息
榆黄菇
实体
生理
作物生长监测技术
成熟度检测装置
空间变换网络
图像分类方法
腔体
像素点
模板匹配技术