摘要
本申请涉及大模型训练领域,特别涉及一种基于大模型的继续预训练的问答方法、装置、设备及介质,方法包括:获取多个基于不同预设长度阈值的切片数据的训练数据集;利用多个超参数对预训练大模型进行继续训练,得到多个初始问答模型,能够通过不同长度的训练数据以及不同的超参数,使得模型在不同超参数下无监督地学习不同长度的文本;通过测试集测试多个初始问答模型,比较不同的初始问答模型的学习情况,以便于从多个初始问答模型确定出最优的问答模型,能够精准的确定符合该场景下的最优的文本长度以及超参数的模型,使得最终确定的问答模型的精准度以及可靠性优异,且,在继续训练过程中不需要依赖人工标记训练数据,降低了人工成本和工作量。
技术关键词
问答模型
问答方法
切片
超参数
数据
应用程序编程接口
中央处理器
可读存储介质
问答装置
文本
依赖人工
电子设备
测试模块
优化器
内存
存储器
计算机
系统为您推荐了相关专利信息
高斯混合模型
预测误差
分区
LSTM神经网络
数据
可视化检测系统
积灰
清洁光伏板
图像校正单元
云监测平台