摘要
本发明涉及数据处理领域,且公开了一种基于AI大模型的数据智能化处理系统,包括在检测到文本中存在多个候选实体时,根据上下文语义相关度及实体历史引用频次,判断候选实体是否需要进行语义消歧处理;构建跨领域上下文表示向量,并引入预训练语言模型对上下文进行编码,生成候选实体的深层语义表示,判断聚类结果是否存在歧义;通过融合语言模型嵌入与结构化知识图谱信息,判断候选实体是否存在冲突;基于图神经网络构建实体关系图,对存在的候选实体间关系进行因果性、时间性与属性依赖推理,判断候选实体间关系是否应合并或拆分实体;结合上下文语境及推理结果,对目标文本中候选实体进行标注替换。本发明具备提高数据处理的准确性的优点。
技术关键词
实体间关系
预训练语言模型
语义相关度
输出模块
聚类
文本
句法依存关系
图谱
数据
编码
嵌入方法
生成结构
关键词
注意力机制
节点
多层结构