摘要
本申请公开了一种基于多源异构行业数据的行业标签关联方法及装置,涉及数据治理技术领域,主要目的在于实现跨行业标签映射准确率、动态优化响应时间的突破性提升。主要的技术方案为:根据数据形式对行业数据进行差异化处理,得到包含关键信息且统一语义表征的标准化元数据;将标准化元数据输入至预先经过多源行业语料改进的Sentence‑BERT++模型中,得到统一语义表征的标准化元数据对应的目标句向量与多个预置行业标签对应的标准句向量之间的语义相似度;若大于预设相似度阈值,则将对应的预置行业标签确定为与行业数据映射的目标行业标签;将行业数据归类至行业标签动态关系图内的目标行业标签中,并更新目标行业标签与其他行业标签之间的标签关联度。
技术关键词
标签关联方法
语义
动态
异构
关系
数据治理技术
字段
偏差
CRF模型
关联装置
处理单元
日志
频率
实体
核心
处理器
周期
程序