摘要
本发明涉及自然语言处理技术领域,公开了一种基于关键词与动态复制机制的文档摘要生成方法。该方法首先改进TextRank算法,通过多因素权重标题相关性、高频词奖励、位置权重信息优化关键词提取,解决传统方法忽略结构性特征的问题;其次构建关键词引导的BART生成模型,将关键词位置权重融入位置编码,通过注意力门控增强关键区域特征;最后设计动态三源指针复制网络,允许解码时从原始文本复制、关键词复制及词汇表生成中动态选择内容。在CNN/Daily Mail和XSum数据集测试中,相应指标表明生成的摘要更加精确,有效解决生成式摘要的关键信息丢失、术语失真及未登录词问题。
技术关键词
文档摘要生成方法
TextRank算法
文档关键词
语义向量
节点
动态
机制
文本
预训练语言模型
生成式摘要
训练注意力
解码器
编码
网络
指针
阻尼
系统为您推荐了相关专利信息
三维模型管理
转换单元
文件夹
零件
可读存储介质