摘要
本发明公开的一种GQL语料生成模型训练方法、装置和存储介质,通过提取图数据库产品手册中的各GQL原始语句及其对应的自然语言描述文本的匹配对,构建初始语料数据集,结合预设等价变换规则和大语言模型对所述初始语料数据集中的各GQL原始语句进行等价变换生成对应GQL变体语句,构建变体语料数据集,结合初始语料数据集与变体语料数据集,构建包括多个正负样本对的正负样本数据集后,将初始语料数据集、变体语料数据集以及构建的正负样本数据集整合为扩充语料数据集,输入目标GQL语料生成模型中对模型进行微调,使目标GQL语料生成模型能够根据输入的自然语言描述文本生成对应的GQL语句,实现高质量、大规模、低成本的GQL语料生成模型训练。
技术关键词
生成模型训练方法
语句
自然语言
样本
数据库产品
文本
模型训练装置
大语言模型
同义词
手册
可读存储介质
处理器
语义
模块
度函数
度量
变量
存储器
计算机
系统为您推荐了相关专利信息
BP神经网络
车辆运行数据
神经网络架构
引入遗传算法
商用车车型
热点检测方法
源节点
制程
集成电路计算机辅助设计技术
样本
振荡监测方法
双模态
周期信号数据
检测工业
频域特征