摘要
本发明公开一种面向中文长文本的混合式自动摘要生成方法,涉及自然语言处理技术领域。本发明以一种无监督方式的抽取式摘要方法为第一阶段,减轻模型的复杂度的同时避免信息损失,压缩长文本内容。然后,基于对比学习构建了生成式摘要模块将含有上下文语义信息的文档级编码表示融入到模型的训练过程中,使模型有效引导生成摘要与标准摘要文本进行对比,避免生成无关信息,解决了生成式文本摘要普遍存在的暴露偏差问题,在降低模型复杂度的同时提升摘要生成的质量。
技术关键词
文本摘要模型
上下文语义信息
摘要生成方法
面向中文
生成式摘要
编码器
摘要方法
字符
生成文本摘要
解码器架构
梯度下降算法
无监督
解码器结构
模块
序列
复杂度