一种基于大模型的继续预训练的问答方法、装置、设备及介质

正文

推荐专利

申请号：CN202510107801

申请日期：2025-01-23

公开号：CN119848216A

公开日期：2025-04-18

类型：发明专利

摘要

本申请涉及大模型训练领域，特别涉及一种基于大模型的继续预训练的问答方法、装置、设备及介质，方法包括：获取多个基于不同预设长度阈值的切片数据的训练数据集；利用多个超参数对预训练大模型进行继续训练，得到多个初始问答模型，能够通过不同长度的训练数据以及不同的超参数，使得模型在不同超参数下无监督地学习不同长度的文本；通过测试集测试多个初始问答模型，比较不同的初始问答模型的学习情况，以便于从多个初始问答模型确定出最优的问答模型，能够精准的确定符合该场景下的最优的文本长度以及超参数的模型，使得最终确定的问答模型的精准度以及可靠性优异，且，在继续训练过程中不需要依赖人工标记训练数据，降低了人工成本和工作量。

技术关键词

问答模型问答方法切片超参数数据应用程序编程接口中央处理器可读存储介质问答装置文本依赖人工电子设备测试模块优化器内存存储器计算机

系统为您推荐了相关专利信息

基于样本增强的信审小结优化方法

知识图谱模型样本文本征信数据节点

一种用于比赛与训练的智能跳绳数据交互方法

智能跳绳数据交互方法加密数据服务端指令

一种基于高斯混合模型的光伏预测误差评估方法

高斯混合模型预测误差分区 LSTM神经网络数据

基于深度学习的光伏板积灰可视化检测系统及云监测平台

可视化检测系统积灰清洁光伏板图像校正单元云监测平台

基于全生命周期的铜产品碳足迹数据收集及处理方法

产品碳足迹卷积模型阶段异常设备动态

一种基于大模型的继续预训练的问答方法、装置、设备及介质

站点导航

APP 下载