摘要
本申请提供了一种基于法律法规文本分块的文本检索方法、设备及介质,涉及文本检索领域,方法包括:获取法律法规领域的文档及其摘要总结;将每个文档的每一节法规条款文本作为基本分块单元;根据阈值L,将各个基本分块单元划分长文本和短文本,得到文本块;将文本块之后存储到FAISS向量数据库中;获取用户提问;在FAISS数据库中检索与用户提问相似的预设个数的检索文本块;通过检索文本块,反向定位到文档中的对应位置,得到与检索文本块相关的上下文内容;将上下文内容、检索文本块对应的摘要总结以及用户提问输入LLM模型中,生成文本检索答案。根据法条的文本长度进行合理分块,解决了上下文丢失和语义不完整问题。
技术关键词
检索文本块
文本检索方法
分块
摘要
网络接口
可读存储介质
分词
语义
设备通信
电子设备
答案
存储器
计算机
指令
处理器
定义
模版