摘要
本发明涉及自然语言处理技术领域,具体涉及一种基于线上调解信息数据的法律文书生成方法及系统,基于调解记录沟通文本中当事方代表的实体词汇的频次出现频率较高的特点,根据每个初始实体词汇在每个语句中的局部出现频次以及在所有语句中的整体出现频次,评估每个初始实体词汇的当事实体筛选指数,从而筛选出所需要的当事方实体词汇;而后基于调解过程中不同当事方实体之间的联系需要较多的词汇进行描述的特点,根据每个实体词汇组与其他每个实体词汇组之间的所有初始实体词汇的数量以及当事实体筛选指数整体大小评估实体词汇组之间的三元实体确权指数,并在此基础上进行更加准确的三元组构建,使得生成的法律文书摘要文本的准确性更高。
技术关键词
法律文书生成方法
语句
三元组
生成法律文书
指数
文本
法律文书生成系统
摘要
案件
命名实体识别
注意力模型
深度学习模型
数据获取模块
元素
序列
自然语言
数值
节点