摘要
本发明涉及大数据处理技术领域,公开了一种基于大数据的多源数据集成方法及系统,从多个不同的数据源中采集原始多源数据,对原始多源数据进行清洗和异常处理,通过分布式计算框架对预处理后的多源数据进行标准化处理;基于标准化后的多源动态数据采用本体感知图卷积网络构建跨域语义知识图谱;基于跨域语义知识图谱进行语义对齐,采用注意力机制提取多模态特征,并通过CP张量分解将多模态特征融合,得到融合后的数据;对实时流数据进行增量更新处理,采用多智能体深度确定性策略梯度集成决策模型实时优化数据集成策略;本发明提高了数据处理的精准度和效率,解决了多源数据语义异构的问题,能够处理海量数据。
技术关键词
数据集成方法
语义知识图谱
分布式计算框架
深度确定性策略梯度
数据集成设备
多模态特征
集成策略
增量更新
注意力机制
网络
数据集成系统
大数据处理技术
分布式文件系统
高维特征向量
可读存储介质
决策
系统为您推荐了相关专利信息
物流管理方法
数字孪生模型
实时数据
数据整合平台
分布式计算框架
动态资源分配方法
深度确定性策略梯度
干扰对齐技术
时分复用帧
动态资源分配系统
检索分析方法
词嵌入模型
倒排索引文件
可视化展示平台
分析用户反馈