一种基于大语言模型的法律条款向量检索方法

AITNT
正文
推荐专利
一种基于大语言模型的法律条款向量检索方法
申请号:CN202411039710
申请日期:2024-07-31
公开号:CN119128182A
公开日期:2024-12-13
类型:发明专利
摘要
本发明涉及检索技术领域,公开了一种基于大语言模型的法律条款向量检索方法,具体按以下步骤执行:首先对输入的合同文档进行处理,将合同分割成多个章节;每个章节进一步根据规则细分为段落;进行加权平均处理,确定最终章节,其中非表格的自然章节根据标题特征进行划分,表格按照表头信息进行按行划分成独立的章节,将每个分割后的章节单独保存,形成多个独立的文本块;其中对于自然段落直接划分为段落,对于列举式需要整体作为一个整体的段落,选择式只将选择式的标题与相应被选中的选项作为一个整体的段落。本发明简洁且效率高,摒弃与风险描述无关信息的影响,可以有效避免合同文本过长,内容过于复杂对于大模型向量检索效果的负面影响。
技术关键词
向量检索方法 大语言模型 文本 表格 检索技术 表头 风险 可读存储介质 开方 词语 分词 列表 计算机 控制器 算法 定义
系统为您推荐了相关专利信息
1
一种管道风险知识图谱构建方法、装置及存储介质
风险 知识图谱构建方法 知识图谱构建装置 管道 节点
2
模型训练方法、文本处理方法及相关设备
模型训练方法 大语言模型 网络 文本处理方法 计算机程序产品
3
一种多模态统计提示学习的小样本新能源设备缺陷识别方法、系统、存储介质及设备
新能源设备 缺陷识别方法 图像编码器 视觉特征 多模态
4
直流保护测试的故障样本扩充方法及装置
直流输电系统 直流保护测试 数据 分布特征 保护装置
5
多模态数据标注的方法、装置、存储介质、设备和产品
多模态 训练分类器 数据标注技术 计算机程序产品 音频
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号