摘要
本发明提供一种海洋及相关产业分类识别方法及系统,包括:步骤S1:建立企业信用信息数据库;步骤S2:获取标准文件,并对标准文件和人工识别样本分别进行文本预处理;步骤S3:根据人工识别样本和所述标准文件,建立涉海企业识别模型;步骤S4:使用涉海企业识别模型对待识别企业进行识别,得到模型识别样本,通过比对模型识别样本和人工识别样本,计算各海洋产业的识别准确率、额外识别比;步骤S5:调整涉海企业识别模型,使用调整后的涉海企业识别模型对待识别企业进行识别,得到企业分类结果;步骤S6:为企业分类结果中的企业,计算对每个被识别的海洋产业的评估分数。本发明能够提高识别结果的准确率,具备可解释性,可展示分类依据。
技术关键词
海洋产业
企业经营范围
分类识别方法
企业信用信息
样本
汉明距离
分类识别系统
随机森林模型
模块
文本
分词
关键词
算法
矩阵
代表
字段
比率
变量