摘要
本发明涉及人工智能模型的知识收集技术领域,具体涉及一种用于生成式人工智能模型的多源异构数据治理方法。本发明提供了一种用于生成式人工智能模型的多源异构数据治理方法。本发明首先提取知识数据中的实体并获取特征向量;进一步根据知识数据中各个方面的实体的数量分布获得侧重指标,再结合数据库内侧重指标的分布,获取每个方面的侧重因子;进一步根据目标数据与其他知识数据在所有相同方面的同义实体的实体相似指标,结合侧重因子,获取佐证指标;最后根据所有其他的知识数据对目标数据的佐证指标,结合所属数据库的可信度权重,获取目标数据的真实可信度并进行数据分层,提升信息筛选准确性、增强模型对关键知识的信任度。
技术关键词
数据治理方法
人工智能模型
实体
指标
异构
SIFT描述符
隐马尔可夫模型
因子
分词
分层
标记
多模态
文本
图像
语义
滤波
核心
框架