摘要
本发明公开了一种基于大数据训练应用的人工智能系统,包括分布式数据采集模块、数据预处理模块、训练集群构建模块、存储模块;所述分布式数据采集模块包括实时采集多源异构数据,包括结构化数据库、非结构化文本、时序传感器数据和网络流数据;所述数据预处理模块获取分布式数据采集模块的输出信息进行并行化数据清洗、特征降维和动态噪声过滤生成标准化数据集;所述训练集群构建模块获取标准化数据集进行样本定量构建为训练用样本集;还包括基于训练用样本集使用的训练模型,所述训练模型输出分类数据至存储模块。本发明与现有技术相比的优点在于:提供一种方便进行数据整理,方便后续提取数据信息的一种基于大数据训练应用的人工智能系统。
技术关键词
人工智能系统
分布式数据采集
大数据
多源异构数据
动态噪声
非结构化文本
人工智能方法
存储模块
样本
集群
神经网络架构
注意力机制
索引
带时间
聚类
系统为您推荐了相关专利信息
财务数据管理系统
风险评估模型
实体
建立映射关系
企业
注意力
智能教学分析系统
时序关联分析
生理
图谱
人工智能系统
开发方法
人工智能模型
人工智能算法
积木模块
三维数字模型
数字孪生模型
模拟系统
风险
环境监测数据