通信和内存高效的大模型分布式训练方法、文本分类方法

正文

推荐专利

申请号：CN202510067042

申请日期：2025-01-16

公开号：CN119474891B

公开日期：2025-08-12

类型：发明专利

摘要

本申请实施例提供了一种通信和内存高效的大模型分布式训练方法、文本分类方法，属于人工智能技术领域。该方法包括：根据模型扰动向量和扰动超参数对原始本地分类模型进行模型扰动，得到第一参考分类模型和第二参考分类模型，通过第一参考分类模型对语言文本进行文本分类，得到第一文本类别，通过第二参考分类模型对语言文本进行文本分类，得到第二文本类别，根据文本类别标签、第一文本类别和第二文本类别计算损失差值，并获取损失差值的原始符号，将原始符号发送给服务器，并接收服务器对原始符号进行聚合得到的目标符号，根据目标符号、模型扰动向量和预设学习率对原始本地分类模型进行更新，得到目标分类模型，能够提高模型训练的效率。

技术关键词

分布式训练方法文本分类方法符号样本类别标签超参数服务器内存终端设备文本分类装置可读存储介质人工智能技术电子设备处理器种子存储器计算机

系统为您推荐了相关专利信息

一种基于多模态强化学习与自适应导纳控制的搬运方法

搬运方法多模态触点轨迹压强

一种基于特征和关系联合知识蒸馏的洪涝灾害识别方法

深度神经网络模型蒸馏识别方法教师学生

AI代码缺陷修复数据集构建方法、缺陷修复方法及设备

数据集构建方法代码缺陷缺陷修复方法计算机程序指令漏洞

跨模态数据对齐模型训练方法、装置、设备及存储介质

语义模型训练方法注意力特征提取网络跨模态数据

基于多层级视图和对比学习的Web长尾服务推荐方法

交互结构符号服务推荐方法层级样本

通信和内存高效的大模型分布式训练方法、文本分类方法

站点导航

APP 下载