摘要
本说明书提供一种预训练方法、交互方法、系统及存储介质,包括:获得预训练数据集,其中,预训练数据集用于学习推理能力和通用能力,推理能力包括代码能力、数学能力,预训练数据集中包括第一数据集和第二数据集,第一数据集侧重于学习代码能力,第二数据集侧重于学习数学能力,根据预训练数据集对基础大语言模型进行多阶段预训练,得到目标大语言模型,其中,微调后的目标大语言模型用于确定与输入问题对应的输出回答。实现了目标大语言模型在推理能力和通用能力的同步提升。
技术关键词
大语言模型
计算机可读非暂时性存储介质
多阶段
数据
交互方法
数学
基础
预训练方法
处理器
训练系统
交互系统
通讯
系统为您推荐了相关专利信息
瞳孔大小变化
AR设备
图像亮度值
生物特征数据
反射点
信号强度监测
子模块
状态实时监测
模式切换单元
状态监测单元
无人艇
多模态深度学习
参数识别方法
参数识别装置
融合多源数据
滤波
人脸识别模型
分量特征
小波变换处理
人脸识别模块
随机森林模型
多模型协同
样本
决策树训练
分类器