摘要
本发明实施例提供一种文档摘要的提取方法、系统、电子设备及存储介质,属于导航技术领域。该方法包括:将待提取摘要的文档解析为片段,生成片段集;并进行光学字符识别形成初步语义文本,并确定第一token序列;对片段集中的插图进行图像类型识别,形成结构描述文本,并确定第二token序列;识别待提取摘要的文档的行业或领域标签,并确定对应的编码;将第一第二token序列及标签对应的编码输入至预先构建的摘要提取模型,获得摘要文本。基于循环神经网络的图文型文档摘要生成方案,利用关键语义提取、文档结构提取、文档行业或领域识别,从企业文档中提炼关键语义和关键插图,形成图文型的文档摘要,其具有针对性,概括能力强。
技术关键词
摘要
光学字符识别
文本
序列
语义
双向长短期记忆
阅读器单元
标签
TextRank算法
编码器
非暂态计算机可读存储介质
注意力
图像
关键字
解码器框架
词嵌入向量
电子设备
语句
系统为您推荐了相关专利信息
异常数据检测方法
动环监控系统
接口日志
实时监测数据
时间序列预测模型