摘要
本申请提供了一种长文档语义连贯性处理方法、装置、存储介质和计算机设备,该方法包括:通过滑动窗口变换器对长文档进行分块编码,滑动窗口变换器包括窗口划分单元、位置编码单元和变换器编码单元,窗口划分单元根据句子和段落边界调整分块位置,并在相邻块之间设置重叠区域;通过记忆管理模块存储和管理编码后的文档内容,记忆管理模块包括篇章级记忆池和门控记忆单元,篇章级记忆池存储文档编码内容,门控记忆单元维护实体及事件时间线;通过语义处理模块对文档内容进行深度语义理解,计算段落间的多维注意力权重捕获依赖关系;通过检索模块提供检索结果;通过内容生成模块生成语义连贯的输出内容。该方案提高了长文档处理的语义连贯性。
技术关键词
位置编码单元
记忆管理
记忆单元
语义
校验组件
变换器
滑动窗口
实体
标记
分块
识别模块
计算机设备
位置映射
更新方法
注意力
指针
编码模块
系统为您推荐了相关专利信息
待测样品图像
轮廓
测试机台
视觉系统
集深度学习