类案检索数据增广方法和装置

AITNT
正文
推荐专利
类案检索数据增广方法和装置
申请号:CN202410880454
申请日期:2024-07-02
公开号:CN119046402A
公开日期:2024-11-29
类型:发明专利
摘要
本发明提供一种类案检索数据增广方法和装置,包括:基于大语言模型对待处理事实数据进行关键事实提取,得到案件描述;利用词性标注工具对所述案件描述进行实体名匿名化处理,得到查询数据,根据所述查询数据和所述待处理事实数据组成查询‑候选对;提取预先构建的样本案件库内的样本案件中的辅助信息,对于所述查询‑候选对,根据所述辅助信息将所述样本案件和所述待处理事实数据进行匹配,得到相似案件;将所述相似案件作为键,将所述查询数据作为查询,得到类案检索训练数据。本发明借助和词性标注工具对待处理事实数据进行概括,标注成本低,同时,利用辅助信息进行知识驱动的数据增广,更加贴近普通用户日常使用场景。
技术关键词
数据增广方法 案件 大语言模型 标注工具 样本 深度神经网络 非暂态计算机可读存储介质 实体 处理器 计算机程序产品 压缩单元 存储器 基座 电子设备 编码 场景
系统为您推荐了相关专利信息
1
一种神经网络计算五轴数控加工刀轨逼近误差的方法
五轴数控 建立神经网络模型 优化神经网络 注意力机制算法 触点
2
一种关键基因识别方法、装置、计算机设备及存储介质
基因识别方法 分词 样本 计算机可读指令 数据
3
语音识别翻译模型的训练方法、语音识别翻译方法及装置
翻译模型 大语言模型 语音识别文本 语音编码器 标签文本
4
模型训练方法、基于提示学习的火灾监测方法及相关设备
模型训练方法 烟火监测 火灾监测方法 文本 视觉
5
对抗扰动生成模型的训练方法及装置
图像识别模型 样本 图片 微调单元 切比雪夫
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号