摘要
本发明提供一种多数据源数据处理方法、设备及存储介质,属于数据处理领域;解决了多数据源数据处理效率低的问题;具体如下:获取每个数据源采集的原始信息并存储;分离独立数据源和联合数据组;对每个独立信息源中的原始信息进行分类,得到主体属性和信息集;根据联合数据组中原始信息的数据类型,确定重要数据源和混合特征向量,并利用混合向量在独立数据源中寻找潜在数据源;更新每个数据源采集的信息,并更新独立数据源的主体属性和信息集,更新联合数据组的重要数据源和潜在数据源;本发明通过对数据源中的信息进行获取、分析和处理,为每个数据源中的数据进行汇总和整理,提高数据处理效率。
技术关键词
数据处理方法
Word2Vec模型
文本特征向量
图像特征向量
样本
矩阵
BERT模型
正则化方法
数值
图像块
词语
网络节点
直方图
序列
链式结构
哈希算法
滤波器
系统为您推荐了相关专利信息
患者
肿瘤
评价方法
输入神经网络模型
分类准确率
协议识别方法
半监督聚类
样本
统计特征
特征选择