摘要
本申请公开了一种大数据企业识别方法、系统、电子设备及存储介质,方法包括:获取企业的企业数据,并进行预处理;将预处理后的企业数据输入Doc2vec模型进行训练,利用训练好的Doc2vec模型计算待预测企业各目标单词文本与已知大数据企业各目标单词文本之间的相关性,并计算待预测企业的所有目标单词文本与已知大数据企业的目标单词文本之间的相关性的均值;将待预测企业的所有目标单词文本与已知大数据企业的目标单词文本之间的相关性的均值输入至训练好逻辑回归模型,预测大数据企业类型的概率,得识别结果。本申请通过综合利用企业多维度数据,结合Doc2vec模型和逻辑回归模型的优势,能够精准地识别大数据企业,并提高了识别效率。
技术关键词
企业经营范围
文本
识别方法
逻辑回归模型
词典文件
分词
计算机程序指令
企业识别系统
词语
识别大数据
电子设备
识别模块
梯度下降法
处理器通信
算法
可读存储介质
系统为您推荐了相关专利信息
编码特征
生成语音信号
识别语音信号
注意力机制
多层感知机层
电信号
QRS波群
上下文特征
融合特征
编码特征
驾驶风格识别方法
历史行驶数据
时间段
模型训练方法
车辆
图像
页面代码
页面测试方法
语义分割模型
光学字符识别
结构特征提取
Lanczos算法
精准匹配方法
多项式核函数
泊松分布模型