摘要
本发明提供一种类案检索数据增广方法和装置,包括:基于大语言模型对待处理事实数据进行关键事实提取,得到案件描述;利用词性标注工具对所述案件描述进行实体名匿名化处理,得到查询数据,根据所述查询数据和所述待处理事实数据组成查询‑候选对;提取预先构建的样本案件库内的样本案件中的辅助信息,对于所述查询‑候选对,根据所述辅助信息将所述样本案件和所述待处理事实数据进行匹配,得到相似案件;将所述相似案件作为键,将所述查询数据作为查询,得到类案检索训练数据。本发明借助和词性标注工具对待处理事实数据进行概括,标注成本低,同时,利用辅助信息进行知识驱动的数据增广,更加贴近普通用户日常使用场景。
技术关键词
数据增广方法
案件
大语言模型
标注工具
样本
深度神经网络
非暂态计算机可读存储介质
实体
处理器
计算机程序产品
压缩单元
存储器
基座
电子设备
编码
场景
系统为您推荐了相关专利信息
五轴数控
建立神经网络模型
优化神经网络
注意力机制算法
触点
翻译模型
大语言模型
语音识别文本
语音编码器
标签文本