摘要
本申请实施例提供一种领域专用大语言模型的训练样本生成方法及训练方法,所述训练样本生成方法包括:对多个数据系统中的异构信息进行采集与预处理,生成与特定优化任务相关的结构化过程数据,并基于所述结构化过程数据,重建与该特定优化任务对应的优化模型的演进轨迹;以及基于所述优化模型的演进轨迹,构建指令微调样本,用于对预训练大语言模型进行定制化训练。本申请提供的方法可以解决具体工程应用中存在的训练数据质量较差的问题。
技术关键词
训练样本生成方法
大语言模型
多源异构信息
网络结构
轨迹
邮件服务系统
模式匹配技术
文档管理系统
版本控制系统
项目管理系统
生成测试数据
指令
节点
参数
建立通信
自然语言
矩阵
系统为您推荐了相关专利信息
中文唇语识别方法
面部关键点
拼音
深度相机
大语言模型
海上风电机组
缺陷识别系统
动态门控
振动特征
声学特征
解堵工艺
堵控制方法
故障检测
感应模块
联动设备
飞行体
多阶段
轨迹模型
拉丁超立方采样
三自由度运动