一种基于大模型的继续预训练的问答方法、装置、设备及介质

AITNT
正文
推荐专利
一种基于大模型的继续预训练的问答方法、装置、设备及介质
申请号:CN202510107801
申请日期:2025-01-23
公开号:CN119848216A
公开日期:2025-04-18
类型:发明专利
摘要
本申请涉及大模型训练领域,特别涉及一种基于大模型的继续预训练的问答方法、装置、设备及介质,方法包括:获取多个基于不同预设长度阈值的切片数据的训练数据集;利用多个超参数对预训练大模型进行继续训练,得到多个初始问答模型,能够通过不同长度的训练数据以及不同的超参数,使得模型在不同超参数下无监督地学习不同长度的文本;通过测试集测试多个初始问答模型,比较不同的初始问答模型的学习情况,以便于从多个初始问答模型确定出最优的问答模型,能够精准的确定符合该场景下的最优的文本长度以及超参数的模型,使得最终确定的问答模型的精准度以及可靠性优异,且,在继续训练过程中不需要依赖人工标记训练数据,降低了人工成本和工作量。
技术关键词
问答模型 问答方法 切片 超参数 数据 应用程序编程接口 中央处理器 可读存储介质 问答装置 文本 依赖人工 电子设备 测试模块 优化器 内存 存储器 计算机
系统为您推荐了相关专利信息
1
基于样本增强的信审小结优化方法
知识图谱模型 样本 文本 征信数据 节点
2
一种用于比赛与训练的智能跳绳数据交互方法
智能跳绳 数据交互方法 加密数据 服务端 指令
3
一种基于高斯混合模型的光伏预测误差评估方法
高斯混合模型 预测误差 分区 LSTM神经网络 数据
4
基于深度学习的光伏板积灰可视化检测系统及云监测平台
可视化检测系统 积灰 清洁光伏板 图像校正单元 云监测平台
5
基于全生命周期的铜产品碳足迹数据收集及处理方法
产品碳足迹 卷积模型 阶段 异常设备 动态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号