摘要
本发明公开了一种基于语义演化图谱的文件自动解析方法,包括:生成政策文档标准化语料库;得到政策文档结构化语料单元集合;构建包含版本戳的初始语义图谱快照;建立时间切片语义演化图谱序列;得到多时序融合向量;生成多时序优化词嵌入向量矩阵;对所述多时序优化词嵌入向量矩阵执行时间连续正则化,输出时间连续词嵌入向量,并映射到所述时间切片语义演化图谱序列的节点与边,形成全局语义演化图谱融合表示序列;以全局语义演化图谱融合表示序列作为特征输入,得到政策文档解析结果集合。本发明大幅提升了政策文档自动解析的时效性、准确率和可解释性。
技术关键词
词嵌入向量
自动解析方法
语义图谱
切片
语义实体
词嵌入模型
术语
时序
序列
快照
节点
三元组
关系预测模型
主题
矩阵
文本