摘要
本申请公开基于大模型的数据质量提升方法、装置及电子设备,涉及数据处理领域,包括:数据调研的步骤、数据准备的步骤、数据提取的步骤、数据清洗的步骤和数据补全的步骤;数据调研的步骤包括,获取道路试验系统中记录的全部试验数据字段;根据信号的数量对比、试验相关性和常用性,对全部试验数据字段进行标记整理;其中,将常用性作为第一优先原则,对全部试验数据字段进行标记整理;数据准备的步骤包括,根据将常用性作为第一优先原则,设置数据规范化处理规则。本申请采用大模型提取试验数据,通过大模型学习数据库中各表的结构和字段含义,使系统可以根据用户指令自动生成查询语句进行试验数据提取。
技术关键词
数据字
电子设备
LSTM神经网络
生成训练数据
异常数据
提升装置
处理器
LSTM模型
标记
通信接口
语句
训练集
数据迁移
模块
矩阵
整理器
存储器
样本
信号