摘要
本申请公开了一种基于大模型的政策文本去噪与关联事项提取方法及系统,涉及数据处理技术领域。该方法包括:收集不同来源的政策文本,构建政策知识库;利用大模型对政策知识库中的政策文本进行分类;从分类后的政策文本中提取具体的事项,并基于预定义的规则对提取的事项进行初步分解;构建政策事项的关联度矩阵,将初步分解的事项与已分解入库的事项进行关联,并根据事项之间的相似度更新事项之间的协同矩阵;基于已关联的事项进行政策关联,构建政策知识图谱。本方案利用大模型和自然语言处理技术,通过对政策文本分类、去噪、提取事项和构建关联度,增强了政策信息的系统化管理和关联关系分析能力,提高了政策文本的处理和分析效率。
技术关键词
矩阵
训练语言模型
自然语言
关联关系分析
构建知识图谱
知识图谱构建
文本去重
数据处理技术
节点
动态更新
聚类算法
哈希表
处理器
模块
关键词
系统为您推荐了相关专利信息
机场道面混凝土
三维点云数据
实时评价方法
聚类
预测机场
自然语言
计算机可执行指令
多轮对话
大语言模型
关键字
跟踪方法
速度估计
跟踪设备
点云配准算法
主成分分析方法