摘要
本说明书实施例提供了文档处理方法及装置、信息检索方法及装置。该文档处理方法能对目标文档的文本内容进行分片处理,得到多个文本片段,之后将每个文本片段输入第一大语言模型进行模型处理,得到处理结果,其中包括若干知识片段,然后根据各知识片段,生成其各自对应于预设的若干标签类别的第一标签数据,并将各知识片段和第一标签数据对应存储到第一数据库,以使得第一标签数据用于知识问答检索。在信息检索方法中,在根据用户的信息检索请求确定出文本形式的用户问题后,根据用户问题生成对应于该若干标签类别的第二标签数据,之后基于第一数据库中的至少部分第一标签数据各自与第二标签数据之间的第一相关性,检索与用户问题相关的知识片段。
技术关键词
标签类别
答案
文本
信息检索方法
大语言模型
数据
关键词
实体
分片
信息检索装置
识别策略
计算机程序产品
意图识别
处理器
存储单元
处理单元