一种基于跨模态知识学习的语义边缘检测方法

正文

推荐专利

申请号：CN202410893174

申请日期：2024-07-04

公开号：CN118736594A

公开日期：2024-10-01

类型：发明专利

摘要

本发明提出了一种基于跨模态知识学习的语义边缘检测方法，所述方法基于语义边缘检测模型实现，所述语义边缘检测模型包括图像编码器、文本编码器、解码器、高层特征增强模块、掩码编码细化模块和分类头。在所述高层特征增强模块和掩码编码细化模块中，本发明分别进行了特征融合，基于静态语言特征和动态语言特征增强图像特征以及精细化最终掩码编码，以丰富特征表示，并提高掩码编码质量，防止信息因长时间传输而丢失。本发明通过整合跨模态融合的新特征来提高生成图像特征的质量，还保证融合特征在传输过程中不丢失信息的情况下直接提高掩模质量，能够实现对待检测图像的语义边缘检测。

技术关键词

语义边缘检测方法边缘检测模型文本编码器跨模态图像编码器知识图谱数据物体标签生成图像特征注意力动态模块解码器校准

系统为您推荐了相关专利信息

一种巡检机器人的巡检方法、系统、介质和设备

彩色图像机械臂巡检方法巡检机器人升降装置

基于深度强化学习大模型的大规模路网交通管控方法

交通管控方法深度强化学习算法大语言模型嵌入方法多尺度滑动窗口

一种知识图谱构建方法、装置、电子设备以及存储介质

知识图谱构建方法神经网络结构文本特征向量注意力机制图像块

一种基于深度学习的阀门启闭状态识别与诊断方法

阀门启闭状态分层解码器阶段序列诊断方法

一种三维开放词汇语义分割模型的训练方法及装置

标签语义分割模型稀疏编码器解码器结构深度映射

一种基于跨模态知识学习的语义边缘检测方法

站点导航

APP 下载