训练大语言模型的方法及装置

AITNT
正文
推荐专利
训练大语言模型的方法及装置
申请号:CN202510225377
申请日期:2025-02-26
公开号:CN120068972A
公开日期:2025-05-30
类型:发明专利
摘要
本说明书实施例提供一种训练大语言模型的方法,该方法包括:获取输出层的目标参数矩阵,其通过对输出层在上一批次训练得到的原始参数矩阵进行归一化处理而得到。通过目标参数矩阵,对输出层的输入向量进行映射处理,得到映射到预设的词表空间的输出结果,该输入向量与输入文本相对应。在得到当前批次包含的各个微批次中各个输入文本对应的输出结果后,确定目标参数梯度,利用目标参数梯度更新原始参数矩阵。
技术关键词
参数 矩阵 大语言模型 文本 分片 计算机 集群 可读存储介质 校正 存储器 处理器 元素
系统为您推荐了相关专利信息
1
一种基于虚拟现实技术的培训课程学习系统和方法
虚拟现实技术 资源 课程学习系统 学习效果评估 模拟真实环境
2
智能问答方法、装置、计算机设备和程序产品
强化学习模型 大语言模型 数据 策略 规划
3
短距离无线物联网芯片的多参数联合自适应功率控制方法
无线物联网芯片 功率控制方法 短距离 多参数 接收端
4
一种流程图识别方法、装置、设备、介质和产品
节点 元素 轮廓特征 识别方法 语义特征
5
基于高能粒子的DDR4 SDRAM固定位错误试验方法与装置
粒子 辐射源 样本 错误数量 曲线
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号