摘要
本发明涉及企业数据治理的分类分级领域,具体涉及一种基于多Embedding模型集成的元数据标签识别方法,包括选择多个预训练Embedding模型;预计算标签库中所有标签名称向量表示,构建标签向量库;接收待分类分级的数据库表字段元数据;分别计算输入元数据与标签库向量的余弦相似度;基于反馈学习机制动态调整各模型权重;更新模型权重,经过T次反馈后,对每个模型的权重增量进行累加,并通过归一化函数确保所有模型权重之和为1。通过集成多个预训练Embedding模型,解决了单一模型在领域泛化方面的局限性问题。通过反馈学习机制动态调整模型权重,避免了传统方法中“非黑即白”的简单判断,提升了分类分级的准确性。同时,在出现性能更强的模型后可随时替换,扩展性强。
技术关键词
数据标签识别方法
企业数据治理
多语言
预训练模型
机制
语义
动态
模块
编码
文本
场景
系统为您推荐了相关专利信息
计费策略
生成方法
样本
注意力机制
计算机程序产品
环境传感器数据
三维重建模型
高维特征向量
深度学习模型
深度学习算法
定位方法
末端执行器
标注软件
果实
图像识别技术