基于多模态的DiffusionDet小孩过闸检测装置与方法

AITNT
正文
推荐专利
基于多模态的DiffusionDet小孩过闸检测装置与方法
申请号:CN202510360813
申请日期:2025-03-26
公开号:CN120655955A
公开日期:2025-09-16
类型:发明专利
摘要
本发明公开基于多模态的DiffusionDet小孩过闸检测装置与方法,使用RGB图像和深度图融合信息进行多模态融合的扩散去噪神经网络检测模型的网络架构,该网络架构能提取多尺度特征,并以其能够捕获高层语义信息以及细粒度细节的能力为动力,该网络架构包含两个分支,分别用于处理单目图片和深度图,将RGB图像和深度信息编码到特征空间,RGB图像包含物体的视觉外观、纹理细节和识别场景视觉方面的所需颜色信息。深度图能够提供具有物体形状和位置的空间和几何信息。再通过特征融合结合RGB图像和深度信息的优势,形成统一的特征表示。融合后的特征结合噪声框,提取ROI特征送入到检测头进行扩散逆过程去噪,最终得到小孩的检测框。
技术关键词
特征金字塔网络 多模态 小孩 图片 双目摄像头 生成深度图 双目镜头 网络架构 生成噪声 残差结构 预测类别 融合算法 高层语义信息 交叉注意力机制 噪声量 检测头 模块
系统为您推荐了相关专利信息
1
基于Agent的交互式内容生成方法、装置、电子设备及存储介质
文本 生成方法 生成交互式内容 多模态 滑动窗口
2
数据分析方法、装置、设备、存储介质和程序产品
电信号 融合去噪 多模态 数据分析方法 噪声信息
3
一种基于视觉的机器人摘钩方法
车钩 图像特征向量 彩色图像 深度Q网络 热成像
4
基于语义流的实时高保真视频传输的多模态方法
高保真视频 重构视频序列 视觉特征 表达式 文本
5
一种基于YOLO的起重机关键部件缺陷检测方法
缺陷检测方法 起重机 通道剪枝 上采样方法 YOLO模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号