摘要
本发明涉及电力数据治理技术领域,提供了一种基于多模态融合的数据库表分类治理方法及系统。该方法包括,提取数据中台中的表信息,包括表的元数据信息和历史sql信息;基于提取到的元数据信息和历史sql信息构建多模态融合的特征向量;针对初始数据中台中已有的数据库表,基于其特征向量,计算每个表特征向量间的距离,采用层次聚类法,对数据表进行聚类分析;针对聚类结果中的每一类数据表,为其指定存储方案,形成已有数据库表的存储方案结果;基于已有数据库表的存储方案结果,构建基于注意力的分类模型;采用分类模型对新加入数据中台的数据库中的表进行分类,确定新加入表的存储方案结果。本发明能够自动为表分配最合理的存储方案。
技术关键词
多模态
层次聚类法
计算机程序产品
数据治理技术
序列
注意力
语句
数值
处理器
计算机设备
存储模块
可读存储介质
关系
存储器
键值
基准
系统为您推荐了相关专利信息
偏离误差
训练样本数据
波束
天线振子
神经网络模型