摘要
一种基于图的文档表达性描述方法、系统及可读存储介质。针对机器理解文档易产生歧义问题,借鉴认知语言学互动式识解方式,赋予机器处理和理解文档能力,通过调整框架和认知域参数,使得机器能够从不同角度解读文档。通过语义网技术语义化文档信息资源,框架层面以[词‑句‑篇]层次建模异构图。细粒度用[主语‑谓‑宾语]三元组构建内部图,粗粒度以词、句、文档为节点构建关联图,边权值别用归一化逐点互信息NPMI、TF‑IDF、BM25等算法计算。从认知域角度,运用URI分层解析和灵动图摘要控制解析层次和深度。该方法能消除歧义,构建共享模型,支持知识表示和智能化检索,提升文档处理质效,提供新的有效方案。
技术关键词
三元组
节点
滑动窗口
摘要
异构
解析方法
统一资源标识符
语义网技术
有向图结构
命名实体识别
链接机制
框架
可读存储介质
分层
模块
关系
感兴趣
系统为您推荐了相关专利信息
网络安全感知系统
模糊理论
网络拓扑结构
自检单元
链路