摘要
本申请公开了一种文档识别方法及智能交互方法和相关装置、设备、介质,其中,文档识别方法包括:基于待识别文档进行识别,得到待识别文档中版面元素和版面元素的识别结果;基于标题的识别结果进行分析,得到第一标题序列;修正第一标题序列的标题层级,得到第二标题序列;基于第二标题序列进行验证,得到验证结果;其中,验证结果表征第二标题序列是否无误;响应于验证结果表征第二标题序列有误,选择第二标题序列,作为新的第一标题序列,并返回修正第一标题序列的标题层级,得到第二标题序列的步骤进行迭代,直至满足结束条件为止。上述方案,能够提升文档识别时标题建模的连贯性,以区分文档内各个标题的层级关系,特别是在跨页场景下。
技术关键词
序列
文档识别方法
元素
智能交互方法
语义分析模型
文档识别装置
层级
样本
布局
语句
文本
智能交互装置
识别模块
表格
页面
搜索模块
程序
处理器
系统为您推荐了相关专利信息
风险
概率论方法
设备状态信息
论分析方法
模型更新
负荷预测模型
负荷预测方法
时间序列特征
电力
网络优化
故障分析方法
故障预测数据
序列
故障分析装置
网络
基因序列数据
识别方法
深度注意力机制
构建分类模型
生物