摘要
一种基于小波变换细节增强和文本提示的夜间语义分割方法和装置,其方法包括:获取夜间图像,并对夜间图像进行预处理以及小波图像的重建;将预处理的夜间图像以及小波变换重建后的图像输入深度学习模型进行语义分割,得到夜间场景物体的分割结果。本发明设计构成一种新的三阶段网络结构,在第一阶段,利用由图像编码器、夜间语义类别编码器和小波图像编码器组成的三模态特征提取器提取特征,在第二阶段,设计双分支跨模态特征交互模块,整合不同空间分辨率和语义层次的特征与目标物体的自然语言先验,捕捉从粗粒度到细粒度的全方位语义信息,在第三阶段,引入多尺度特征分割解码器,增强低光区域的细节、捕捉细微的纹理边缘和目标轮廓,通过自然语言先验强化模型对目标区域的定位和理解,能够有效提高夜间场景语义分割的精度。
技术关键词
语义分割方法
图像编码器
文本
深度学习模型
多尺度特征
特征提取器
分支
解码器
跨模态
小波特征
分辨率
视觉对象检测
水平垂直翻转
场景语义分割
特征金字塔网络
交叉注意力机制
系统为您推荐了相关专利信息
时间序列特征
空间测绘技术
节点运行状态
整合电力系统
生成网络拓扑
标记单元
实体识别方法
电表
双向长短期记忆网络
图谱
业务场景预测
项目管理方法
场景知识图谱
语义规则
实体关系数据