通信和内存高效的大模型分布式训练方法、文本分类方法

AITNT
正文
推荐专利
通信和内存高效的大模型分布式训练方法、文本分类方法
申请号:CN202510067042
申请日期:2025-01-16
公开号:CN119474891B
公开日期:2025-08-12
类型:发明专利
摘要
本申请实施例提供了一种通信和内存高效的大模型分布式训练方法、文本分类方法,属于人工智能技术领域。该方法包括:根据模型扰动向量和扰动超参数对原始本地分类模型进行模型扰动,得到第一参考分类模型和第二参考分类模型,通过第一参考分类模型对语言文本进行文本分类,得到第一文本类别,通过第二参考分类模型对语言文本进行文本分类,得到第二文本类别,根据文本类别标签、第一文本类别和第二文本类别计算损失差值,并获取损失差值的原始符号,将原始符号发送给服务器,并接收服务器对原始符号进行聚合得到的目标符号,根据目标符号、模型扰动向量和预设学习率对原始本地分类模型进行更新,得到目标分类模型,能够提高模型训练的效率。
技术关键词
分布式训练方法 文本分类方法 符号 样本类别标签 超参数 服务器 内存 终端设备 文本分类装置 可读存储介质 人工智能技术 电子设备 处理器 种子 存储器 计算机
系统为您推荐了相关专利信息
1
一种基于多模态强化学习与自适应导纳控制的搬运方法
搬运方法 多模态 触点 轨迹 压强
2
一种基于特征和关系联合知识蒸馏的洪涝灾害识别方法
深度神经网络模型 蒸馏 识别方法 教师 学生
3
AI代码缺陷修复数据集构建方法、缺陷修复方法及设备
数据集构建方法 代码缺陷 缺陷修复方法 计算机程序指令 漏洞
4
跨模态数据对齐模型训练方法、装置、设备及存储介质
语义 模型训练方法 注意力 特征提取网络 跨模态数据
5
基于多层级视图和对比学习的Web长尾服务推荐方法
交互结构 符号 服务推荐方法 层级 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号