摘要
本发明提出了一种基于语义分析的案件卷宗的命名实体识别方法及系统,方法包括以下步骤:获取司法案件电子卷宗的原始文本数据,对原始文本数据进行数据预处理并词级划分,得到词元序列;采用滑动窗口机制对词元序列进行处理,提取句法短语和片段特征信息,并融合生成候选片段特征集;定义实体类型,并与候选片段特征向量进行相似度计算,获取相似度分值最高的实体类型与候选片段进行关联,生成扁平实体集合;构建预定义结构化模板,采用预训练的分类模型将实体匹配到预定义结构化模板的槽位中,得到初始的结构化实例集合;该方法既可实现对卷宗中关键实体的高效识别,又能自动构建实体间的结构化关系和事件信息,提升了案件语义抽取的全面性、准确性和处理效率。
技术关键词
命名实体识别方法
案件
滑动窗口机制
语义
分类模型识别
扁平
关系
前馈神经网络
模板
命名实体识别系统
序列
计算机存储介质
文本段落
注意力
关联属性信息
标签
数据
图谱
系统为您推荐了相关专利信息
三元组
语义
覆盖率
工业故障检测
更换IGBT模块
延迟优化方法
空间索引结构
语义向量
焦点
上下文语义信息