摘要
本发明提出了一种基于大语言模型的有害知识图谱构建与有害信息识别方法,有效降低了大语言模型有害信息识别时的假阳性率。首先收集标注好的数据集并进行数据预处理得到初始数据;然后利用大语言模型解释文本内容有害的原因,进而提取出核心三元组,最后再检查提取的三元组是否传递了有害信息,在经过节点去重之后组成有毒知识图谱;接着引入图检索增强生成,对于待判断文本,首先由大语言模型进行实体提取,然后在图上进行检索,找到相关的子图,给大语言模型提供相关的背景知识;最后在模型推理时,进行判别和解释。本发明通过大语言模型构建了有害信息的知识图谱,提高了有害信息识别准确率,缓解了大语言模型在有害信息识别时过于敏感的问题。
技术关键词
大语言模型
三元组
文本
有害信息识别
实体
知识图谱构建
格式
识别方法
数据
节点
细粒度分类
定义
核心
标签
网络平台
聚类算法
有毒有害
语义
系统为您推荐了相关专利信息
测试脚本生成方法
自然语言
规划
单元测试框架
人机
表单填写方法
数据
界面
电子设备
计算机程序产品
前馈神经网络
文本
数据处理方法
大语言模型
计算机程序产品