基于序列长度的大模型分布式训练自适应方法和系统

正文

推荐专利

申请号：CN202510093769

申请日期：2025-01-21

公开号：CN120124713A

公开日期：2025-06-10

类型：发明专利

摘要

本发明属于信息技术领域，涉及一种基于序列长度的大模型分布式训练自适应方法和系统。该方法包括：测试不同长度序列数据的最佳训练策略；在训练数据预处理中对短序列数据进行拼接，并将拼接后的数据按照长度分成不同的微批次；在训练过程中根据微批次中训练数据的长度动态调整训练策略。本发明通过三个阶段定制化动态训练策略，以适应长尾分布数据集的特点，能够高效地处理长序列的拼接，大幅减少了填充符号的使用，在保持训练范式不变的前提下显著提升了训练效率。

技术关键词

序列分布式训练并行策略数据存储计算机程序动态可读存储介质测试模块计算机设备算法存储器处理器符号样本阶段指令

系统为您推荐了相关专利信息

患者二十四小时出入量实时监测方法及预警系统

实时监测方法数据医护终端对象胃肠减压

一种卫星遥感影像处理系统及方法

卫星遥感影像卫星遥感图像数据同步系统接收系统采集系统

基于ISCSO-KELM的矿井突水水源精准判识方法及系统

判识方法正则化参数矿井突水水源识别策略煤矿安全技术

一种视频理解的细粒度基准数据集构建方法和系统

数据集构建方法视频答案基准人物特征

一种量子处理器并行测控系统及方法

测控系统数据管理模块线路任务调度波形

基于序列长度的大模型分布式训练自适应方法和系统

站点导航

APP 下载