一种基于多Embedding模型集成的元数据标签识别方法

正文

推荐专利

申请号：CN202511033517

申请日期：2025-07-25

公开号：CN120929981A

公开日期：2025-11-11

类型：发明专利

摘要

本发明涉及企业数据治理的分类分级领域，具体涉及一种基于多Embedding模型集成的元数据标签识别方法，包括选择多个预训练Embedding模型；预计算标签库中所有标签名称向量表示，构建标签向量库；接收待分类分级的数据库表字段元数据；分别计算输入元数据与标签库向量的余弦相似度；基于反馈学习机制动态调整各模型权重；更新模型权重，经过T次反馈后，对每个模型的权重增量进行累加，并通过归一化函数确保所有模型权重之和为1。通过集成多个预训练Embedding模型，解决了单一模型在领域泛化方面的局限性问题。通过反馈学习机制动态调整模型权重，避免了传统方法中“非黑即白”的简单判断，提升了分类分级的准确性。同时，在出现性能更强的模型后可随时替换，扩展性强。

技术关键词

数据标签识别方法企业数据治理多语言预训练模型机制语义动态模块编码文本场景

系统为您推荐了相关专利信息

一种交直流混合配电网低碳配置方法

交直流混合配电网光伏系统储能装置层级数据

计费策略生成方法、装置、设备、存储介质及产品

计费策略生成方法样本注意力机制计算机程序产品

一种基于3D高斯散射的桥梁结构检测方法及系统

环境传感器数据三维重建模型高维特征向量深度学习模型深度学习算法

一种结合深度学习和RGB-D信息融合的葡萄采摘点的定位方法

定位方法末端执行器标注软件果实图像识别技术

一种基于边缘探测的多模态大语言模型隐喻表征方法

大语言模型表征方法多模态矩阵注意力机制

一种基于多Embedding模型集成的元数据标签识别方法

站点导航

APP 下载