一种基于法律法规文本分块的文本检索方法、设备及介质

AITNT
正文
推荐专利
一种基于法律法规文本分块的文本检索方法、设备及介质
申请号:CN202510322514
申请日期:2025-03-19
公开号:CN120296116A
公开日期:2025-07-11
类型:发明专利
摘要
本申请提供了一种基于法律法规文本分块的文本检索方法、设备及介质,涉及文本检索领域,方法包括:获取法律法规领域的文档及其摘要总结;将每个文档的每一节法规条款文本作为基本分块单元;根据阈值L,将各个基本分块单元划分长文本和短文本,得到文本块;将文本块之后存储到FAISS向量数据库中;获取用户提问;在FAISS数据库中检索与用户提问相似的预设个数的检索文本块;通过检索文本块,反向定位到文档中的对应位置,得到与检索文本块相关的上下文内容;将上下文内容、检索文本块对应的摘要总结以及用户提问输入LLM模型中,生成文本检索答案。根据法条的文本长度进行合理分块,解决了上下文丢失和语义不完整问题。
技术关键词
检索文本块 文本检索方法 分块 摘要 网络接口 可读存储介质 分词 语义 设备通信 电子设备 答案 存储器 计算机 指令 处理器 定义 模版
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号