摘要
本发明涉及一种应用于小微企业行业识别的方法及系统,属于计算机技术领域,解决现有技术依赖人工核验的问题。方法包括:1.基于《国民经济行业分类》对历史企业分组,整合工商、信贷、司法及供应链数据构建多维度指标画像,优化分组形成经营特征相似的新行业标签体系;2.关联清洗工商数据、发票数据与国标类目,结合新标签体系制定经营行为关联的打标关键字规则,生成模型训练样本;3.基于样本设计文本组织结构和模型架构,训练行业识别模型。本发明创新性融合结构化发票数据与异构工商数据,针对行业文本特征构建自然语言模型与时序模型组合架构,实现端到端行业分类识别,解决了传统方法主观性强、效率低的问题。
技术关键词
标签体系
发票
关键字
文本
数据
画像
清洗企业
LSTM模型
深度学习模型
风险类指标
自然语言模型
更新模型参数
梯度下降算法
深度学习技术
模型训练模块
样本
组织
系统为您推荐了相关专利信息
配电网电压暂降
电压暂降评估指标
接入配电网
出力场景
机组
分布式光伏
非侵入式负荷分解
估计方法
基线
分布式资源
评估模型构建方法
材料抗空蚀
空蚀设备
精密天平
参数