摘要
本发明公开了基于空间位置与场景关联的文本检测识别模型校准方法,包括:根据目标文本序列的似然最大化和目标位置的绝对距离最小化对端到端文本检测识别模型进行监督获得识别损失;通过文本关联序列挖掘模型构建文本关联序列集;通过空间位置平滑方法构建文本平滑位置集;根据文本关联序列集联合正则内容损失实现文本内容置信度校准;根据文本平滑位置集联合正则位置损失实现文本位置置信度校准;引入全局校准强度系数联合正则内容损失和正则位置损失构建正则化损失函数,实现总体的可控性端到端置信度校准;联合识别损失和正则化损失得到最终损失以训练得到校准后的端到端文本检测识别模型,用于输出预测文本序列、位置及校准的置信度。
技术关键词
模型校准方法
场景文本图像
序列
标记特征
图像编码器
视觉特征
平滑方法
语义
注意力
解码器
字符
网络
坐标
强度
系统为您推荐了相关专利信息
特征优化方法
特征选择
信息交互机制
滑动窗口
Sigmoid函数
车辆定位方法
车辆定位装置
转移概率矩阵
人工神经网络模型
加速直线运动
甘蓝型油菜
筛选方法
标记
基因组测序数据
遗传多样性分析
滑动窗口
预警方法
优化LSTM模型
图像
预警模型