一种基于多Embedding模型集成的元数据标签识别方法

AITNT
正文
推荐专利
一种基于多Embedding模型集成的元数据标签识别方法
申请号:CN202511033517
申请日期:2025-07-25
公开号:CN120929981A
公开日期:2025-11-11
类型:发明专利
摘要
本发明涉及企业数据治理的分类分级领域,具体涉及一种基于多Embedding模型集成的元数据标签识别方法,包括选择多个预训练Embedding模型;预计算标签库中所有标签名称向量表示,构建标签向量库;接收待分类分级的数据库表字段元数据;分别计算输入元数据与标签库向量的余弦相似度;基于反馈学习机制动态调整各模型权重;更新模型权重,经过T次反馈后,对每个模型的权重增量进行累加,并通过归一化函数确保所有模型权重之和为1。通过集成多个预训练Embedding模型,解决了单一模型在领域泛化方面的局限性问题。通过反馈学习机制动态调整模型权重,避免了传统方法中“非黑即白”的简单判断,提升了分类分级的准确性。同时,在出现性能更强的模型后可随时替换,扩展性强。
技术关键词
数据标签识别方法 企业数据治理 多语言 预训练模型 机制 语义 动态 模块 编码 文本 场景
系统为您推荐了相关专利信息
1
一种交直流混合配电网低碳配置方法
交直流混合配电网 光伏系统 储能装置 层级 数据
2
计费策略生成方法、装置、设备、存储介质及产品
计费策略 生成方法 样本 注意力机制 计算机程序产品
3
一种基于3D高斯散射的桥梁结构检测方法及系统
环境传感器数据 三维重建模型 高维特征向量 深度学习模型 深度学习算法
4
一种结合深度学习和RGB-D信息融合的葡萄采摘点的定位方法
定位方法 末端执行器 标注软件 果实 图像识别技术
5
一种基于边缘探测的多模态大语言模型隐喻表征方法
大语言模型 表征方法 多模态 矩阵 注意力机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号