基于大语言模型的训练语料生成方法、装置、介质及设备

AITNT
正文
推荐专利
基于大语言模型的训练语料生成方法、装置、介质及设备
申请号:CN202510990670
申请日期:2025-07-17
公开号:CN120509494B
公开日期:2025-10-24
类型:发明专利
摘要
一种基于大语言模型的训练语料生成方法、装置、介质及设备,涉及大模型、智能体及人工智能领域,方法包括:将获取的第一错误样本、执行环境和自然语言问题样例输入第二大语言模型,得到用于数据查询的第一自然语言问题及对应的第一结构化查询语句,并基于第一自然语言问题和第一结构化查询语句,得到用于训练第一大语言模型的训练语料。由此可以实现训练语料的自动生成,一方面可以增加训练语料的数量,降低训练语料枯竭的风险,从而在模型训练需求增加的情况下更好的满足模型训练需求;另一方面,可以减少人为参与,提高训练语料的生成效率和质量稳定性。
技术关键词
结构化查询语句 大语言模型 自然语言 语料生成方法 样本 查询关键词 语料生成装置 数据字 查询数据表 存储装置 标签 计算机程序产品 定义 介质 电子设备 模块 字段 处理器
系统为您推荐了相关专利信息
1
轻量级模型构建方法、计算机程序产品及电子设备
大语言模型 模型构建方法 数据 计算机程序产品 处理器
2
一种基于机器学习的海面风速订正方法、装置及介质
风速预测模型 订正方法 线性回归模型 随机森林模型 数据
3
一种基于AI辅助面试的餐饮人才选拔方法
画像 证书 餐饮 数据 核心
4
话题物料的检测方法、装置、设备、存储介质及产品
话题 热点 标签 大语言模型 图片
5
一种考虑风向约束的臭氧时空加权神经网络遥感估算方法及装置
神经网络模型 卫星遥感数据 遥感估算方法 臭氧 站点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号