摘要
本发明属于计算机图像处理技术领域,具体为基于红外视频与深度学习的手腕脉诊点定位方法。本发明的基本步骤为:数据集中的每个红外视频皆有“寸、关、尺“的二维坐标作为深度学习模型的监督信息。深度学习模型以ResNet‑18作为基线架构,并将ResNet‑18中的二维卷积层、二维最大池化层、二维批归一化层等,以三维卷积层、三维最大池化层、三维批归一化层等作置换。ResNet‑18中每个残差模块结合基于LSTM的时序注意力模块,以特征图作为输入,并输出时序轴的注意力权重分布,让模型专注于信息量较多的特征图,更好地捕捉红外视频的时序信息。最后将待测定的手腕红外视频作为已训练完成的深度学习模型的输入,预测得到手腕脉诊点的坐标。
技术关键词
残差模块
定位方法
训练深度学习模型
视频
坐标
计算机图像处理技术
构建深度学习网络
注意力
时序
训练集
关键点
模型超参数
红外摄像机
数据分布
基线
优化器
系统为您推荐了相关专利信息
泡沫
辐射传输模型
遥感反演方法
覆盖率
估计方法
地下连续墙
参数
展示实体
三维网格模型
模拟模型
视觉传感器
焊缝特征点
跟踪系统
工件固定架
跟踪方法