摘要
本申请公开了基于大模型的政务公文引文检索方法、装置、设备及介质,涉及人工智能技术领域,包括:获取政务公文,确定所述政务公文对应的文档切片,并基于所述文档切片创建文档知识库以及向量知识库;利用目标预训练自然语言处理模型对所述政务公文中的专业术语进行识别,以获取相应的识别结果;基于所述文档知识库和所述向量知识库利用目标信息检索算法对所述识别结果进行关键词匹配,以获取相应的多个候选引文文档;通过reranker模型对各所述候选引文文档与所述识别结果进行语义相关性评分,根据相应的评分结果对各所述候选引文文档进行重排序,并根据相应的重排序结果输出目标引文文档。由此,本申请可以提升引文检索的效率。
技术关键词
政务
检索方法
切片
自然语言
关键词
信息检索
语义
可读存储介质
深度学习模型
存储计算机程序
算法
人工智能技术
检索装置
分词
匹配模块
输出模块
识别模块
处理器
电子设备
系统为您推荐了相关专利信息
三维图像处理
三维图像数据
图像结构
自然语言
矩阵
物联网终端设备
数据检索系统
身份
阶段
数据验证
思政教育
个性化知识图谱
概念
资源库
智能匹配方法
多模态语音
课堂场景
音频
自动语音识别系统
视频