摘要
本发明提供了一种基于大数据的数据要素智能识别与提取方法和装置,方法包括实时采集多源异构数据流并进行特征向量化转换生成分布式存储的数据特征向量;通过密度聚类分析划分数据聚类簇,根据簇中心特征向量定位原始缓存数据中的核心数据要素;解析核心数据要素生成结构化要素标签并构建带时间属性的要素关联矩阵序列;基于矩阵序列和数据源特征模板生成标准化数据表征单元并组合为时序化要素图谱;最终向目标系统输出结构化要素标签和时序化要素图谱。本发明可以实现数据要素的自动化识别、标准化表征及动态关联挖掘,提升跨域数据融合效率与要素价值转化能力。
技术关键词
矩阵
特征模板
图谱
核心
序列
标签
时序
大数据
标识
字段
任务调度
资源分配
异构
编码
关系
特征数据库
数据采集单元
语义
快照
系统为您推荐了相关专利信息
语音评价方法
特征提取模块
联合损失函数
语音音频数据
位置编码单元
异构计算框架
数据存储
芯片
云平台
协同管理方法