数据库问答模型训练方法及装置、存储介质、计算机设备

正文

推荐专利

申请号：CN202510677422

申请日期：2025-05-23

公开号：CN120822571A

公开日期：2025-10-21

类型：发明专利

摘要

本申请公开了一种数据库问答模型训练方法及装置、存储介质、计算机设备，方法包括：将达标结构化查询语言语句、达标执行结果回答和达标自然语言问题进行关联，生成训练用标注数据；收集针对数据库可能提出的模拟衍生问题，得到训练用非标注数据。基于GRPO强化学习框架，以双塔模型所提供的评分奖励函数为基础，利用训练用标注数据对评分奖励函数进行训练，以及对数据库问答模型进行监督微调训练，结合训练用非标注数据、格式奖励、可执行奖励以及评分奖励函数的评分奖励，对进行监督微调训练后的数据库问答模型继续进行训练。通过少量标注数据进行初步训练，再由非标注数据进行后续训练，能够激发模型的推理能力，减少标注成本，提高训练效率。

技术关键词

结构化查询语言语句自然语言问答模型训练方法数据库结构执行器强化学习框架开源数据库计算机设备少量标注数据格式生成可执行编码深度学习模型机制处理器训练装置语义模块

系统为您推荐了相关专利信息

一种基于人工智能大模型的消费者权益保护方法及云平台

权益保护方法嵌入特征多模态分类特征模态特征

一种机器人工具快换装置训练台

机器人工具快换装置嵌入式控制系统工具盘机械臂驱动器

车辆目标轨迹约束的确定方法、装置、设备和存储介质

路面附着系数计算机执行指令障碍物模式悬架执行器

基于知识图谱的病理实验室ISO15189智能迎检辅助系统

辅助系统知识图谱构建文档生成模块定性风险评估样本

基于专利知识图谱的电力技术创新贡献度评价方法及系统

三元组 BP神经网络构建评价特征技术创新评价方法

数据库问答模型训练方法及装置、存储介质、计算机设备

站点导航

APP 下载