摘要
本发明公开了一种基于CNN与Transformer深度交互融合双分支边缘检测方法及系统,涉及计算机视觉和深度学习的技术领域,该方法包括:通过一个基于CNN的精细语义边缘分支,利用EfficientNet‑B2骨干网络提取多尺度的局部特征,并结合侧输出结构进行深度监督;同时,通过一个基于轻量化Transformer的全局上下文分支,采用高效局部注意力机制捕捉图像的长距离依赖关系;本发明的核心在于,设计并实现了一个跨注意力模块,将CNN分支提取的局部特征作为键Key和值Value,Transformer分支的特征作为查询Query,从而实现两个分支在特征层面的深度交互与融合,而非简单的特征拼接;此外,本发明还采用了一个由平衡二元交叉熵损失、焦点损失和Dice损失等动态加权组合的统一损失函数进行模型优化。
技术关键词
边缘检测方法
分支
上下文特征
空间注意力网络
图像块
多尺度特征
输出模块
语义特征
输出特征
融合卷积网络
局部注意力机制
矩阵
多源特征融合
序列化特征
多头注意力机制
系统为您推荐了相关专利信息
动作检测方法
计算机可读取存储介质
解析器
视觉
动作检测装置
直流电压控制单元
柔性直流输电系统
特性等效电路
建模分析方法
有功功率
股骨头缺血性坏死
风险预测方法
机器学习模型
文本
风险预测模型