一种GQL语料生成模型训练方法、装置和存储介质

AITNT
正文
推荐专利
一种GQL语料生成模型训练方法、装置和存储介质
申请号:CN202410865642
申请日期:2024-07-01
公开号:CN118410060B
公开日期:2024-09-13
类型:发明专利
摘要
本发明公开的一种GQL语料生成模型训练方法、装置和存储介质,通过提取图数据库产品手册中的各GQL原始语句及其对应的自然语言描述文本的匹配对,构建初始语料数据集,结合预设等价变换规则和大语言模型对所述初始语料数据集中的各GQL原始语句进行等价变换生成对应GQL变体语句,构建变体语料数据集,结合初始语料数据集与变体语料数据集,构建包括多个正负样本对的正负样本数据集后,将初始语料数据集、变体语料数据集以及构建的正负样本数据集整合为扩充语料数据集,输入目标GQL语料生成模型中对模型进行微调,使目标GQL语料生成模型能够根据输入的自然语言描述文本生成对应的GQL语句,实现高质量、大规模、低成本的GQL语料生成模型训练。
技术关键词
生成模型训练方法 语句 自然语言 样本 数据库产品 文本 模型训练装置 大语言模型 同义词 手册 可读存储介质 处理器 语义 模块 度函数 度量 变量 存储器 计算机
系统为您推荐了相关专利信息
1
基于BP神经网络的商用车载重估算方法
BP神经网络 车辆运行数据 神经网络架构 引入遗传算法 商用车车型
2
一种跨制程节点的芯片版图热点检测方法
热点检测方法 源节点 制程 集成电路计算机辅助设计技术 样本
3
一种基于AI数字人的交互回复生成方法及系统
编码特征 回复生成方法 情绪特征 关键词 图谱
4
基于跨模态语义关联学习的运动姿态生成方法
姿态特征 姿态归一化 序列 跨模态 语义
5
基于视觉-频域双模态融合网络的工业过程振荡监测方法及装置
振荡监测方法 双模态 周期信号数据 检测工业 频域特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号