基于空间位置与场景关联的文本检测识别模型校准方法

正文

推荐专利

申请号：CN202411580630

申请日期：2024-11-07

公开号：CN119516530B

公开日期：2025-05-09

类型：发明专利

摘要

本发明公开了基于空间位置与场景关联的文本检测识别模型校准方法，包括：根据目标文本序列的似然最大化和目标位置的绝对距离最小化对端到端文本检测识别模型进行监督获得识别损失；通过文本关联序列挖掘模型构建文本关联序列集；通过空间位置平滑方法构建文本平滑位置集；根据文本关联序列集联合正则内容损失实现文本内容置信度校准；根据文本平滑位置集联合正则位置损失实现文本位置置信度校准；引入全局校准强度系数联合正则内容损失和正则位置损失构建正则化损失函数，实现总体的可控性端到端置信度校准；联合识别损失和正则化损失得到最终损失以训练得到校准后的端到端文本检测识别模型，用于输出预测文本序列、位置及校准的置信度。

技术关键词

模型校准方法场景文本图像序列标记特征图像编码器视觉特征平滑方法语义注意力解码器字符网络坐标强度

系统为您推荐了相关专利信息

一种基于双轨协同进化的高维异构流量动态特征优化方法

特征优化方法特征选择信息交互机制滑动窗口 Sigmoid函数

基于驾驶行为和惯性导航的GNSS短时失效下的车辆定位方法、车辆定位装置和系统

车辆定位方法车辆定位装置转移概率矩阵人工神经网络模型加速直线运动

面向语义通信的丢包补偿方法及系统

语义深度学习模型补偿方法接收端发送端

一种甘蓝型油菜分子标记组合、芯片及其应用

甘蓝型油菜筛选方法标记基因组测序数据遗传多样性分析

一种基于DIC及LSTM的悬垂岩失稳预警方法

滑动窗口预警方法优化LSTM模型图像预警模型

基于空间位置与场景关联的文本检测识别模型校准方法

站点导航

APP 下载