用于生成式人工智能模型的多源异构数据治理方法

正文

推荐专利

申请号：CN202511446215

申请日期：2025-10-11

公开号：CN120910053A

公开日期：2025-11-07

类型：发明专利

摘要

本发明涉及人工智能模型的知识收集技术领域，具体涉及一种用于生成式人工智能模型的多源异构数据治理方法。本发明提供了一种用于生成式人工智能模型的多源异构数据治理方法。本发明首先提取知识数据中的实体并获取特征向量；进一步根据知识数据中各个方面的实体的数量分布获得侧重指标，再结合数据库内侧重指标的分布，获取每个方面的侧重因子；进一步根据目标数据与其他知识数据在所有相同方面的同义实体的实体相似指标，结合侧重因子，获取佐证指标；最后根据所有其他的知识数据对目标数据的佐证指标，结合所属数据库的可信度权重，获取目标数据的真实可信度并进行数据分层，提升信息筛选准确性、增强模型对关键知识的信任度。

技术关键词

数据治理方法人工智能模型实体指标异构 SIFT描述符隐马尔可夫模型因子分词分层标记多模态文本图像语义滤波核心框架