摘要
本发明提供一种裁判文书的分段方法、装置、电子设备及存储介质,其中方法包括:将目标裁判文书输入Bert模型,得到目标裁判文书中每一句文本的向量化表征;基于每一句文本的向量化表征,对目标裁判文书进行分段,初步分段结果;基于每一句文本的向量化表征,确定目标裁判文书的每一句文本的上下文信息,并基于上下文信息,对所述初步分段结果进行调整,得到所述目标裁判文书的最终分段结果。通过将裁判文书输入Bert模型,得到每一句文本的向量化表征,基于上下文信息,进一步优化分段结果,使得分段更加符合裁判文书的实际结构。最终分段结果不仅考虑了单独句子的语义信息,还通过上下文关系进一步提高了分段的准确性。
技术关键词
裁判文书
分段
文本
网络
非暂态计算机可读存储介质
样本
注意力机制
标签
语义特征
条件随机场
案件
电子设备
处理器
计算机程序产品
关系
存储器
模块
逻辑