模型训练方法、文本分类方法、装置、电子设备及介质

正文

推荐专利

申请号：CN202510350975

申请日期：2025-03-24

公开号：CN119848556B

公开日期：2025-09-16

类型：发明专利

摘要

本申请实施例提供了一种模型训练方法、文本分类方法、装置、电子设备及介质，属于人工智能技术领域。该方法包括：在当前迭代轮次，将随机种子和投影参数分别加入种子队列和投影队列，依次从种子队列中获取一个目标随机种子，根据目标随机种子生成目标高斯伪随机向量，根据目标随机种子获取投影队列中的投影参数，得到目标投影参数，并将目标高斯伪随机向量和目标投影参数相乘，确定目标零阶梯度估计，根据预设学习率、预设动量参数、每个目标随机种子在种子队列中的位置标识和对应的目标零阶梯度估计对预设大语言模型的模型参数进行更新，直至当前迭代轮次达到预设迭代次数阈值，得到目标大语言模型，能够减少模型训练所需的内存空间。

技术关键词

大语言模型自然语言文本种子队列模型训练方法文本分类方法参数阶梯先进先出文本分类装置标签电子设备标识可读存储介质人工智能技术处理器决策指数存储器

系统为您推荐了相关专利信息

一种机器人运动控制调优方法、装置、设备和介质

机器人运动控制深度强化学习调优方法机器人状态信息大语言模型

一种在线课程学习效果评估模型训练方法及评估方法

学习效果评估点击流数据学生在线模型训练方法

语音交互方法、服务器和计算机可读存储介质

语音交互方法指令大语言模型槽位识别可读存储介质

一种基于残差自回归交叉注意力机制的特征增强方法

交叉注意力机制大语言模型无监督模块矩阵

一种基于大语言模型的多智能体控制系统、控制方法

多智能体强化学习纠错模块体控制系统数据收集模块数据获取模块

模型训练方法、文本分类方法、装置、电子设备及介质

站点导航

APP 下载