摘要
本公开涉及数据处理技术、人工智能技术、大模型技术、大语言模型技术领域,公开了数据处理方法、装置、计算机设备、存储介质及程序产品,其中,数据处理方法包括:获取待处理查询语句的语句代码;对语句代码进行预处理,得到第一代码;对第一代码中的待补全代码进行标注,得到第二代码;根据第一代码与第二代码确定训练数据,其中,训练数据用于训练语言模型对语句代码进行补全。本公开可以对语句代码进行预处理,得到第一代码,并对第一代码中的待标注代码进行标注,以得到第二代码,并根据第一代码与第二代码确定语言模型的训练数据,以制定针对查询语句的处理逻辑,提高了训练数据的质量,进而提高语言模型补全的查询语句的精确性。
技术关键词
切片
语句
数据处理方法
抽象语法树
计算机设备
查询数据表
训练语言模型
可读存储介质
数据处理装置
大语言模型
人工智能技术
数据处理技术
指令
计算机程序产品
存储器
处理器
字符
模块
系统为您推荐了相关专利信息
蛋白质翻译后修饰
多头注意力机制
特征提取模块
Adam算法
疾病关联预测方法