摘要
本发明属于计算机视觉技术领域,公开了一种基于双向交互的多任务密集预测方法及相关装置;其中,所述多任务密集预测方法包括:基于获取的RGB图像,利用训练好的多任务密集预测模型进行多任务预测,获得各任务预测结果;所述多任务密集预测模型包括:编码器,用于输入RGB图像,输出任务通用特征;解码器,用于输入任务通用特征,输出最终增强的各任务特有特征;多任务密集预测中各任务对应的任务头,分别用于输入最终增强的各任务特有特征并进行预测,对应输出各任务预测结果。本发明解决了多任务密集预测中跨任务交互充分性与交互效率的矛盾,能够获得更精细准确的多任务密集预测结果。
技术关键词
多任务
通用特征
融合特征
多尺度
解码器
扫描模块
状态空间模型
编码器
阶段
令牌
分支
上采样
非暂态计算机可读存储介质
机制
序列
图像
通道
计算机视觉技术
尺寸
系统为您推荐了相关专利信息
语音识别模型
音频编码器
文本编码器
语义
大语言模型
表情生成方法
动作捕捉设备
参数
数据
面部关键点
组合模块
道路交通数据
分支
并行特征提取
融合多尺度特征
多源异构数据
负荷转供
恢复方法
有向无环图
故障预测模型
自动扫描方法
超声机器人
扫描探头
扫描控制程序
编码深度信息