摘要
本申请涉及图像处理技术领域,具体公开了一种基于深度学习的回单签名位置与角度智能识别方法及装置,方法包括:获取原始回单图像,对原始回单图像进行数据增强处理获取样本回单图像;将样本回单图像输入预设的深度学习分类模型进行粗分类,对粗分类对应的分类结果进行角度细调,输出精确角度校正参数;对角度校正后的样本回单图像进行文本提取,根据文本提取结果与预设的签名区域关键词进行匹配,实现对样本回单图像中签名区域的粗定位,输出粗定位区域;对粗定位区域进行搜索,生成候选签名区域框,合并多个候选签名区域框对应的重叠候选框,并利用边界回归优化候选签名区域框的坐标,输出样本回单图像对应的签名位置坐标及运单角度。
技术关键词
深度学习分类模型
多尺度滑动窗口
样本
智能识别方法
坐标
轮廓区域
校正
抑制背景噪声
关键词
模板匹配算法
NLP技术
边缘检测算法
图像视觉特征
智能识别装置
图像输入单元
注意力机制
文本行
系统为您推荐了相关专利信息
风险识别模型
参数
深度学习算法
初始化方法
样本
数据识别方法
语义
文本特征向量
文本编码器
样本