摘要
刑事司法案件三元组抽取模型及预测方法,属于自然语言处理领域,用于法律判决预测中的法条预测和罪名预测任务,要点是构建数据集;所述数据集中根据适用法条和/或判决罪名的频率设置频率标签,且低频标签的数据进行数据增强以及外部知识引入;获取当前样本的相似样本;数据集中与当前样本具有相同法条和/或判决罪名的数据为当前样本的相似样本;获取当前样本在数据集中的不相似样本;数据集中与当前样本不具有相同法条和/或罪名的数据,且不具有低频标签的数据为当前样本的不相似样本;将当前样本、相似样本中的任一个,以及不相似样本中的一个组合为当前样本的案例三元组。
技术关键词
样本
三元组
低频标签
注意力
数据
判决预测方法
记忆单元
案件
大语言模型
频率
解码器
矩阵
电子设备
关键词
高频标签
自然语言
参数
程序