摘要
本发明提出了一种结构化文档标题的自动构建方法,能为具有长上下文的结构化文档自动生成标题。该方法包括以下步骤:第一步,通过基于层次注意力网络的摘要生成模块,利用文档的结构信息和内容特征生成结构化文档的摘要;第二步,使用基于双向编码器和自回归解码器的文本生成模型,从摘要中生成关键词,并通过关键词筛选机制优选关键词;第三步,利用交叉注意力机制分析筛选后的关键词与摘要之间的相互作用,生成融合关键词特征与文档内容的特征表示;第四步,根据特征表示自动构建结构化文档标题。整个流程自动化完成,且能获得与结构化文档内容相关的标题。
技术关键词
自动构建方法
摘要
生成关键词
文本生成模型
关键词生成模型
关键词特征
序列
编码器
词嵌入模型
解码器
神经网络模型
权重分配机制
交叉注意力机制
层次注意力
解码模块
损失函数优化
误差反向传播