基于大语言模型的训练语料生成方法、装置、介质及设备

正文

推荐专利

申请号：CN202510990670

申请日期：2025-07-17

公开号：CN120509494B

公开日期：2025-10-24

类型：发明专利

摘要

一种基于大语言模型的训练语料生成方法、装置、介质及设备，涉及大模型、智能体及人工智能领域，方法包括：将获取的第一错误样本、执行环境和自然语言问题样例输入第二大语言模型，得到用于数据查询的第一自然语言问题及对应的第一结构化查询语句，并基于第一自然语言问题和第一结构化查询语句，得到用于训练第一大语言模型的训练语料。由此可以实现训练语料的自动生成，一方面可以增加训练语料的数量，降低训练语料枯竭的风险，从而在模型训练需求增加的情况下更好的满足模型训练需求；另一方面，可以减少人为参与，提高训练语料的生成效率和质量稳定性。

技术关键词

结构化查询语句大语言模型自然语言语料生成方法样本查询关键词语料生成装置数据字查询数据表存储装置标签计算机程序产品定义介质电子设备模块字段处理器

系统为您推荐了相关专利信息

轻量级模型构建方法、计算机程序产品及电子设备

大语言模型模型构建方法数据计算机程序产品处理器

一种基于机器学习的海面风速订正方法、装置及介质

风速预测模型订正方法线性回归模型随机森林模型数据

一种基于AI辅助面试的餐饮人才选拔方法

画像证书餐饮数据核心

话题物料的检测方法、装置、设备、存储介质及产品

话题热点标签大语言模型图片

一种考虑风向约束的臭氧时空加权神经网络遥感估算方法及装置

神经网络模型卫星遥感数据遥感估算方法臭氧站点

基于大语言模型的训练语料生成方法、装置、介质及设备

站点导航

APP 下载