摘要
本公开提供一种大模型优化方法、装置及介质,涉及计算机技术领域,所述方法包括:获取基础大模型底座,基础大模型底座包括基础大模型和对基础大模型的输出进行奖励的基础奖励模型;使用目标领域多个专业场景的优质样本组成泛化数据,对基础大模型进行泛化训练,以获得目标领域的泛化大模型;使用目标领域每个专业场景的优质样本和非优质样本组成专业数据,对基础奖励模型和泛化大模型进行垂直训练,以获得目标领域每个专业场景的特生大模型;将特生大模型各自部署至目标领域的各个专业场景中进行应用。本公开采用元学习的思想提升大模型的泛化能力,加入奖励模型增加垂直训练时的可用样本量,避免优质样本量较少带来的训练不平衡问题。
技术关键词
专业
基础
模型优化方法
场景
数据采集功能
样本
底座模块
可读存储介质
优化装置
容器
计算机
参数
处理器
系统为您推荐了相关专利信息
螺旋楼梯
模型生成方法
建筑工程设计技术
坐标
曲面