摘要
本发明公开了一种基于大模型技术的政策标签化方法及系统,涉及人工智能技术领域,该方法的实现包括:从政府网站和政策数据库采集政策文本,并进行清洗、分词、实体识别;基于Transformer架构训练政策语义理解模型,并通过对比学习优化长尾语义识别能力;政策知识图谱构建:存储政策实体、标签及其关联关系,支持动态更新和语义推理;利用大模型生成候选标签,结合知识图谱进行语义匹配和优先级排序;提供标签审核、修正及反馈功能,通过Active Learning优化模型。本发明解决传统政策文本标签化过程中效率低、准确性差、依赖人工干预等问题,能够提高效率与准确性,增强语义理解能力,并支持动态扩展。
技术关键词
知识图谱构建
语义理解模型
动态更新
机器可读程序
文本
分布式爬虫技术
实体
支持用户自定义
分词
训练专用
标签系统
可视化界面
标签体系
人工智能技术
增量更新
计算机
关系
系统为您推荐了相关专利信息
石英晶片
智能评估模型
多模态数据采集
半监督学习模型
图谱
划定方法
文本
图像预处理技术
Kruskal算法
时序