一种问答大模型训练方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202510878810

申请日期：2025-06-27

公开号：CN120671851A

公开日期：2025-09-19

类型：发明专利

摘要

本申请公开了一种问答大模型训练方法、装置、设备及存储介质，涉及模型训练技术领域，包括：从目标问答系统中获取相应的历史真实问答对数据，并将历史真实问答对数据导入至待训练问答大模型对应的训练系统中；基于历史真实问答对数据、当前量化参数和当前激活值量化粒度对待训练问答大模型进行模型训练，以得到当前待训练问答大模型；在模型训练中，基于混合粒度FP8精度流策略对当前激活值量化粒度进行实时调整，以及基于预设扩展函数对优化器状态的当前量化参数进行实时调整；在满足预设模型训练结束条件下，将当前待训练问答大模型确定为目标问答大模型，以便对用户端的提问进行回答。这样一来，可以提升模型的训练速度降低大模型的训练门槛。

技术关键词

问答对数据模型训练方法问答系统训练系统优化器参数模型训练技术策略模型训练装置模型训练模块精度数据格式意图可读存储介质处理器电子设备门槛存储器

系统为您推荐了相关专利信息

辅助驾驶环境下的驾驶主体识别方法及系统

主体识别方法工况一维卷积神经网络分类器人工神经网络

一种具备长短期记忆的自学习智能问答系统及方法

智能问答系统记忆专属数据店铺智能问答方法

一种肠镜图像检测方法、装置及电子设备

环形卷积特征特征提取器图像检测方法特征提取模块

面向低轨卫星星座的模型协同可信训练系统及方法

低轨卫星星座分片训练系统节点参数

一种金融产品的推荐方法及系统

金融大语言模型多模态特征融合特征深度学习模型

一种问答大模型训练方法、装置、设备及存储介质

站点导航

APP 下载