摘要
本发明公开了一种基于网络通信的多维度数据采集分析系统及方法,属于数据采集分析技术领域。本发明设计分布式爬虫架构,采集企业动态数据和市场动态数据,构建关系图谱;基于关系图谱计算产业热力图指标,得到产业热力图;定义招商目标,基于企业动态数据构建企业画像,筛选符合招商目标的企业画像,得到候选企业集;计算招商区域与企业特征的匹配度,得到匹配度集合;使用梯度提升树基于匹配度集合训练排序模型,输出企业的推荐得分,得到推荐企业集;计算地理适配度和产业协同性,输入随机森林模型,得到企业的入驻概率;当企业的入驻概率不符合阈值时,在招商区域内筛选更优地块,最大化企业的入驻概率。
技术关键词
数据采集分析方法
分布式爬虫架构
热力图
随机森林模型
构建企业画像
梯度提升树
网络通信
数据采集分析系统
图谱
关系
特征工程
排序模型
实体
数据采集分析技术
高速公路出入口
指标
节点
系统为您推荐了相关专利信息
多模态数据融合
时钟同步协议
管网拓扑结构
密度分布特征
可燃气体传感器
生成热力图
异常检测方法
语义特征
关键点
特征提取网络
集成学习策略
随机森林模型
贝叶斯统计模型
管理算法
指数
随机森林模型
智能识别方法
高维特征向量
灰度共生矩阵
直方图
读取配置文件
策略
sigmoid函数
监测网络流量
指数