摘要
本发明涉及数据处理技术领域,具体涉及基于裁判文书的案件关键词提取方法及系统,方法包括:获取多种案件类型的所有裁判文书,通过TF‑IDF算法获取当前裁判文书的每个词汇的TF值、IDF值和TF‑IDF值,并确定当前裁判文书中的低频词汇和高频词汇;对于低频词汇,根据低频词汇位于每个关键分段的可能性对其TF‑IDF值进行修正;对于高频词汇,确定属于法律术语的高频词汇,根据属于法律术语的高频词汇的分布均匀性对其TF‑IDF值进行修正;修正完成后,根据当前文档的所有词汇的TF‑IDF值确定当前裁判文书的关键词,以完成当前裁判文书的案件关键词提取,提高了对裁判文书的关键词提取的准确性和专业性。
技术关键词
裁判文书
关键词提取方法
案件
术语
分段
特征词库
信息熵
肘部法则
数据处理技术
数值
频率
存储器
处理器
算法
焦点
总量
系统为您推荐了相关专利信息
冷补沥青混合料
施工优化方法
轻质
气压
仿真平台
数字模型构建方法
拼装角度
接触网支架
隧道断面
参数
监测方法
阶段
分段
RNN神经网络
神经网络模型