摘要
公开了一种基于大数据建模分析挖掘互联网特定行为对象的方法和系统,包括实时接入互联网数据,利用流式处理技术,基于预先构建的域名关键词知识库,对所接入数据的域名及相关动作进行校验,以确定其是否符合预定规则;将经校验符合预定规则的数据存储至离线数据库,从离线数据库中提取预定时间范围内的数据,选取关键属性进行深度分析计算,通过分组统计相关属性的信息,结合预设的积分计算规则,综合评定并推送具有不同风险等级标识的上网宽带数据;通过数据关联逻辑推导出与之相关联的活跃网络虚拟账号数据;基于预设的多维度标签规则,对离线流式数据中的各类关键信息进行分析与标记,推送出风险活跃上网宽带和活跃网络虚拟账号数据。
技术关键词
大数据建模分析
挖掘互联网
账号
网站访问信息
离线
标签
网络
对象
校验单元
数据存储
时间段
关键词
分析单元
基础
风险
标记
邮箱
逻辑