摘要
本发明涉及一种基于大模型的智能化元数据治理方法,包括如下步骤:选取若干开源数据库或若干企业级数据库组成数据集,同时合成指令微调训练集;构建数据处理模块并使用指令微调训练集进行训练,利用交叉熵损失函数计算模型生成损失,并采用Adma优化器对其进行参数训练优化;最终将定义好的指令设计模块和训练好的数据处理模块合并构成元数据处理模型。本发明方法可以有效的将目标数据进行治理,在治理过程中生成和完善元数据中的对于数据库的字段描述和表名描述,使其对数据库的中文描述更加准确。
技术关键词
数据治理方法
拼音首字母
数据处理模块
微调模板
开源数据库
样本
指令
企业级数据库
数据处理模型
训练集
数据格式
编码向量
矩阵
参数
表达式
定义
系统为您推荐了相关专利信息
无人机航拍图像
分割方法
网络
通道注意力机制
模型训练模块
室内外定位系统
移动定位终端
一体化基站
北斗地基
基站位置信息
智能农业机器人
作物虫害
数据处理模块
数据采集模块
数据储存模块
建筑负荷预测方法
负荷预测模型
历史负荷数据
网络
搜索全局