摘要
本申请提供一种信息抽取方法、服务器、存储介质及程序产品。该方法将信息抽取问题转换为链接关系分类问题,对于包含给定实体类别和文档文字信息的输入文本序列,通过多模态模型结合文档图像和文字信息中文本标记的位置坐标,预测任意两个文本标记间的链接关系,充分利用实体和实体类别间的隐含关系,可更好地理解复杂文档结构,精准预测文本标记间的链接关系;根据任意两个文本标记间的链接关系,解析得到文档包含的实体信息,可提升信息抽取的精准度;且经一次推理即可获得各类型链接关系的预测结果,提升了信息抽取的效率;另外,可以根据实际应用场景灵活地给定待抽取的实体类别集合,可以适应新兴实体类别和多变的文档布局。
技术关键词
标记
实体
关系
序列
多模态
信息抽取方法
坐标
图像
矩阵
计算机执行指令
服务器
可读存储介质
计算机程序产品
文本识别
编码
处理器通信
样本
数据
系统为您推荐了相关专利信息
关键点检测方法
分层特征
场景
多模态信息
激光雷达点云数据
寿命预测模型
电感器
监测防护方法
历史运行数据
预测误差