摘要
本申请涉及一种多模型协同的企业实体混合识别方法及装置,其包括对企业数据进行采集,获取企业原始数据,并对原始数据进行预处理,获取预处理数据;基于BERT‑BiLSTM‑CRF模型对文本主题指标集进行实体边界识别,输出实体候选标签,基于XGBoost模型对结构化特征集进行分类,输出实体类别概率,基于图神经网络对第三方量化特征集的实体关联关系推理,输出实体间关联权重;通过主题实体关联校验、ESG可信度修正及加权投票融合,生成包含实体名称、类别、关联关系及可信度评分的最终识别结果;基于最终识别结果及历史标注样本集,通过SMOTE算法对稀有实体类别进行过采样生成合成样本并更新训练集,迭代优化基础模型参数,输出优化后的多模型协同识别框架。
技术关键词
XGBoost模型
混合识别方法
多模型协同
CRF模型
SMOTE算法
非结构化文本
财务
标签
融合主题信息
样本
实体关联关系
企业
语义向量
数据
指标
训练集
系统为您推荐了相关专利信息
硅基气凝胶
硅基纳米结构
智能设计方法
多模态
参数
预警系统
实时数据处理
隐私保护模块
多模型协同
高效算法
驾驶员实时疲劳检测系统
疲劳检测方法
驾驶员疲劳检测系统
人脸关键点检测
连续型数据
财务
集成树模型
交互特征
LightGBM模型
XGBoost模型
手势特征识别
标定方法
电压
XGBoost模型
指令