摘要
本发明公开了一种用于构建多源数据分析流程的系统及方法,涉及多源数据分析优化技术领域,该方法包括以下步骤:基于互联网进行多源数据采集,包括网页数据抓取、社交媒体数据采集、公共数据库数据摘取,通过建立多源分析数据库;根据用户输入的关键词,基于多源分析数据库匹配关联数据,对于相关数据进行关联度分析,基于关联度进行降序排列,优先展示关联度高的匹配数据;对匹配的相关数据进行类别划分,结合首次展示的内容以及用户的后续操作。本发明通过对用户输入的关键词进行释义分类,结合多源分析数据库获得关联数据并结合释义类别进行标记,同时基于用户的访问行为对展示数据进行动态调整,增强了实用性与功能性。
技术关键词
网页数据抓取
模糊匹配算法
标记
爬虫软件
文本关键词提取
匹配模块
数据采集模块
中文分词工具
同义词
输入模块
代表
动态
互联网
社交
媒体
展示页面
系统为您推荐了相关专利信息
定位控制方法
取样机器人
深度传感器
基准标记物
坐标