摘要
本发明提供一种基于多维度实时流数据的工业企业信用评价方法及装置,涉及大数据与信用评价技术领域。该方法包括:基于企业公开登记信息,根据国民经济行业分类标准及市县区域划分对小微企业进行初步分类;利用线性判别分析LDA模型从企业公开登记信息中提取企业基本信息的文本特征,生成表征企业类别的词序列特征,并基于词序列特征与预设行业主题的相似度匹配结果对企业进行分级;通过Flink CDC实时流处理技术对企业公开运营数据进行多维数据关联融合,生成融合数据,并基于融合数据计算企业信用评价结果;其中,公开运营数据包括企业经营性数据、招投标交易数据及电子商务平台交易数据中的至少一项。本发明能够提升企业信用评价精确度。
技术关键词
企业信用评价方法
LDA模型
技术对企业
序列特征
数据
电子商务平台
信用评价技术
指数
工业
文本
主题
可读存储介质
停用词表
中文分词
周期
同义词
线性
模块