摘要
本发明属于自然语言处理技术领域,尤其涉及一种基于课程学习的司法类案检索方法及系统。该方法的过程如下:提取司法数据库中的每个司法案例的五个关键要素;以关键要素为节点,要素间的关联关系为边,将司法数据库转换为图;利用转换的图对案例匹配模型进行初级训练;利用K‑core算法将图划分为不同规模的子图,从子图获取初级课程训练案例对和高级课程训练案例对,并利用其对案例匹配模型进行两轮基于课程学习的初级和高级训练;由案例匹配模型生成查询案例的邻接矩阵;进而确定候选案例。计算查询案例与各个候选案例的相似度,对候选案例按相似度排序后输出。本发明解决现有类案检索无法识别文本语义关联、检索的准确性度不高的技术问题。
技术关键词
司法类案检索方法
BERT模型
节点
司法类案检索系统
矩阵
元素
启发式方法
关系
样本
自然语言
算法
语义
实体
存储器
处理器
编码
非线性
案件
邻居
主题