摘要
本发明属于自然语言处理技术领域,公开了一种信息密度计算方法及其应用系统,包括语义单元抽取模块、多属性加注模块、信息密度评分模块、密度分布建模模块、下游应用接口模块;语义单元抽取模块从原始文本中通过融合分词、句法依存分析与语义角色标注,识别主谓宾结构、专有名词组合及动宾短语,结合领域词典与概念本体统一术语表达,输出结构化的语义单元列表。本发明提出了一种从语义结构层面建模信息密度的新方法,区别于词频统计或黑盒概率方法,强调结构可解释性、属性组合性与应用适配性,尤其适用于智能摘要、文档压缩、语义标注、知识图谱构建等场景,具备明确的新颖性、实用性与可推广性。
技术关键词
密度计算方法
语义角色标注
热力图
滑动窗口
接口模块
文本
知识图谱推理
可视化接口
知识图谱构建
独立语义
高密度
段落结构
语义结构
词频统计
动态
低密度
嵌套结构
系统为您推荐了相关专利信息
叶片检测方法
匈牙利匹配算法
表型特征
特征金字塔网络
光照
异常状况
异常事件
道路监控视频图像
车辆运动状态
交互结构
时间序列特征
输送机
注意力机制
门控循环单元
刮板
照度
反射率
注意力机制
分层
Retinex算法