摘要
本申请实施例提供了一种通信和内存高效的大模型分布式训练方法、文本分类方法,属于人工智能技术领域。该方法包括:根据模型扰动向量和扰动超参数对原始本地分类模型进行模型扰动,得到第一参考分类模型和第二参考分类模型,通过第一参考分类模型对语言文本进行文本分类,得到第一文本类别,通过第二参考分类模型对语言文本进行文本分类,得到第二文本类别,根据文本类别标签、第一文本类别和第二文本类别计算损失差值,并获取损失差值的原始符号,将原始符号发送给服务器,并接收服务器对原始符号进行聚合得到的目标符号,根据目标符号、模型扰动向量和预设学习率对原始本地分类模型进行更新,得到目标分类模型,能够提高模型训练的效率。
技术关键词
分布式训练方法
文本分类方法
符号
样本类别标签
超参数
服务器
内存
终端设备
文本分类装置
可读存储介质
人工智能技术
电子设备
处理器
种子
存储器
计算机
系统为您推荐了相关专利信息
数据集构建方法
代码缺陷
缺陷修复方法
计算机程序指令
漏洞
语义
模型训练方法
注意力
特征提取网络
跨模态数据