摘要
本发明涉及检索技术领域,公开了一种基于大语言模型的法律条款向量检索方法,具体按以下步骤执行:首先对输入的合同文档进行处理,将合同分割成多个章节;每个章节进一步根据规则细分为段落;进行加权平均处理,确定最终章节,其中非表格的自然章节根据标题特征进行划分,表格按照表头信息进行按行划分成独立的章节,将每个分割后的章节单独保存,形成多个独立的文本块;其中对于自然段落直接划分为段落,对于列举式需要整体作为一个整体的段落,选择式只将选择式的标题与相应被选中的选项作为一个整体的段落。本发明简洁且效率高,摒弃与风险描述无关信息的影响,可以有效避免合同文本过长,内容过于复杂对于大模型向量检索效果的负面影响。
技术关键词
向量检索方法
大语言模型
文本
表格
检索技术
表头
风险
可读存储介质
开方
词语
分词
列表
计算机
控制器
算法
定义
系统为您推荐了相关专利信息
风险
知识图谱构建方法
知识图谱构建装置
管道
节点
模型训练方法
大语言模型
网络
文本处理方法
计算机程序产品
新能源设备
缺陷识别方法
图像编码器
视觉特征
多模态
直流输电系统
直流保护测试
数据
分布特征
保护装置
多模态
训练分类器
数据标注技术
计算机程序产品
音频