训练大语言模型的方法及装置

正文

推荐专利

训练大语言模型的方法及装置

申请号：CN202510225377

申请日期：2025-02-26

公开号：CN120068972A

公开日期：2025-05-30

类型：发明专利

摘要

本说明书实施例提供一种训练大语言模型的方法，该方法包括：获取输出层的目标参数矩阵，其通过对输出层在上一批次训练得到的原始参数矩阵进行归一化处理而得到。通过目标参数矩阵，对输出层的输入向量进行映射处理，得到映射到预设的词表空间的输出结果，该输入向量与输入文本相对应。在得到当前批次包含的各个微批次中各个输入文本对应的输出结果后，确定目标参数梯度，利用目标参数梯度更新原始参数矩阵。

技术关键词

参数矩阵大语言模型文本分片计算机集群可读存储介质校正存储器处理器元素

系统为您推荐了相关专利信息

一种基于虚拟现实技术的培训课程学习系统和方法

虚拟现实技术资源课程学习系统学习效果评估模拟真实环境

智能问答方法、装置、计算机设备和程序产品

强化学习模型大语言模型数据策略规划

短距离无线物联网芯片的多参数联合自适应功率控制方法

无线物联网芯片功率控制方法短距离多参数接收端

一种流程图识别方法、装置、设备、介质和产品

节点元素轮廓特征识别方法语义特征

基于高能粒子的DDR4 SDRAM固定位错误试验方法与装置

粒子辐射源样本错误数量曲线

训练大语言模型的方法及装置

站点导航

APP 下载