基于空间位置与场景关联的文本检测识别模型校准方法

AITNT
正文
推荐专利
基于空间位置与场景关联的文本检测识别模型校准方法
申请号:CN202411580630
申请日期:2024-11-07
公开号:CN119516530B
公开日期:2025-05-09
类型:发明专利
摘要
本发明公开了基于空间位置与场景关联的文本检测识别模型校准方法,包括:根据目标文本序列的似然最大化和目标位置的绝对距离最小化对端到端文本检测识别模型进行监督获得识别损失;通过文本关联序列挖掘模型构建文本关联序列集;通过空间位置平滑方法构建文本平滑位置集;根据文本关联序列集联合正则内容损失实现文本内容置信度校准;根据文本平滑位置集联合正则位置损失实现文本位置置信度校准;引入全局校准强度系数联合正则内容损失和正则位置损失构建正则化损失函数,实现总体的可控性端到端置信度校准;联合识别损失和正则化损失得到最终损失以训练得到校准后的端到端文本检测识别模型,用于输出预测文本序列、位置及校准的置信度。
技术关键词
模型校准方法 场景文本图像 序列 标记特征 图像编码器 视觉特征 平滑方法 语义 注意力 解码器 字符 网络 坐标 强度
系统为您推荐了相关专利信息
1
一种基于双轨协同进化的高维异构流量动态特征优化方法
特征优化方法 特征选择 信息交互机制 滑动窗口 Sigmoid函数
2
基于驾驶行为和惯性导航的GNSS短时失效下的车辆定位方法、车辆定位装置和系统
车辆定位方法 车辆定位装置 转移概率矩阵 人工神经网络模型 加速直线运动
3
面向语义通信的丢包补偿方法及系统
语义 深度学习模型 补偿方法 接收端 发送端
4
一种甘蓝型油菜分子标记组合、芯片及其应用
甘蓝型油菜 筛选方法 标记 基因组测序数据 遗传多样性分析
5
一种基于DIC及LSTM的悬垂岩失稳预警方法
滑动窗口 预警方法 优化LSTM模型 图像 预警模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号