摘要
本发明提供一种基于大语言模型的知识图谱涉诈主体分析和补全方法,对原始采集到的涉诈网站样本和正常网站样本进行清洗,再对涉诈实体进行抽取和关系梳理,然后通过知识图谱映射到图数据库中得到预处理后的结构化数据并进行知识图谱优化,基于大预言模型对知识图谱进行链接推理和链接补全,使用PageRank算法计算知识图谱中每个节点之间相互的链接权重,获取到每个节点的在全局图谱中的关系权重,然后计算节点之间的相似度,找出与已知涉诈节点相似的所有未知涉诈节点。本发明将基于大语言模型补全的知识图谱应用于涉诈关系补全和涉诈主体发掘领域,通过相似性探求涉诈实体间关系网络,利用模型进行实体关系的补全和诈骗主体的分析。
技术关键词
大语言模型
补全方法
知识图谱优化
PageRank算法
短信
节点
命名实体识别
三元组
保留标签信息
样本
转化方法
结点
实体间关系
文本
关系型数据库
清洗方法