摘要
本申请公开了一种企业的行业分类信息的识别方法、装置及程序产品,涉及大数据领域,该方法包括:从外部数据源获取企业的发票数据,并提取发票数据中包含的商品信息集合;通过训练后的词向量模型将每个企业的商品信息集合转换为第一词向量集合,通过词向量模型将每个企业的行业分类信息转换为第二词向量;通过加权计算相似度的方式对第二词向量和第一词向量集合进行计算,得到每个企业和每个企业的行业分类信息之间的相似度;依据相似度识别N个企业的行业分类信息是否正确,得到N个企业的识别结果。通过本申请,解决了相关技术中金融机构对公信贷业务中,企业自主登记的行业分类信息或者基于个人经验确定的行业分类信息存在错误的问题。
技术关键词
企业
数据获取请求
识别方法
销项发票
词语
词向量模型
计算机程序产品
信息更新
转换单元
识别装置
大数据
处理器
电子设备
凭证
字体
时间段
系统为您推荐了相关专利信息
标签
分析模块
词嵌入模型
分析方法
审计数据处理
AI算法
识别方法
多任务学习策略
多分支卷积神经网络
数据
多维特征向量
输入神经网络模型
物理
多层感知机
清洗鞋子