摘要
本发明涉及人工智能技术领域,公开了一种垂直领域大模型的训练方法,所述方法包括:S10,收集初始训练数据集;S20,基于所述项目代码对初始大模型进行预训练直至所述初始大模型学习到所述项目代码的风格和数据格式;S30,通过初始训练数据集对所述初始大模型进行监督微调,获得贴合垂直领域要求的监督微调阶段大模型;S40,通过筛选所述监督微调使用的部分数据,结合监督微调阶段大模型自身输出数据,构建奖励模型训练数据集;S50,根据所述奖励模型训练数据集对所述监督微调阶段大模型进行奖励模型训练,得到一个经过排序评分训练过的奖励模型;S60,通过所述奖励模型和全部收集到的数据,对监督微调阶段大模型进行训练,获得垂直领域的专用大模型。
技术关键词
覆盖率
阶段
数据收集模块
项目
训练装置
数据格式
格式化
人工智能技术
脚本
风格
训练集
日志
参数
框架
系统为您推荐了相关专利信息
无人机协同
路径优化方法
卡车
两阶段
模拟退火算法
路径规划方法
动态障碍物
修剪策略
地图模型
节点
风电场微观选址
气候
风电场选址技术
动态空气密度
非对称布局
数据处理方法
训练机器学习模型
模型训练方法
样本
问答系统