大语言模型的训练方法、装置、电子设备及介质

AITNT
正文
推荐专利
大语言模型的训练方法、装置、电子设备及介质
申请号:CN202410857063
申请日期:2024-06-28
公开号:CN118821850B
公开日期:2025-03-28
类型:发明专利
摘要
本发明提供了一种大语言模型的训练方法、装置、电子设备及介质。所述大语言模型的训练方法包括:根据目标序列长度M以及用于进行训练的当前设备的硬件支持的最大长度N对待训练的大语言模型进行初始化;读取作为训练样本的文本序列;根据所述目标序列长度M和最大长度N动态的对所述文本序列进行预处理,得到数据分块;其中,所述数据分块的长度与最大长度N相匹配,且在所述文本序列的序列长度小于长度阈值时对文本序列进行填充;根据所述数据分块对所述大语言模型进行训练,以基于训练后的大语言模型进行自然语言处理。本发明能够在有限的硬件资源下实现有效的超长文本训练,使得大规模语言模型训练更加经济高效。
技术关键词
大语言模型 序列 文本 分块 自然语言 数据 编码 电子设备 计算机 动态 训练装置 处理器通信 指令 可读存储介质 索引 存储器 参数
系统为您推荐了相关专利信息
1
一种基于大数据分析的数字化管理方法及系统
数字化管理方法 语义 乘法器 序列 子系统
2
一种病原微生物基因组数据库的构建方法
群体遗传结构 嵌套结构 缓存替换策略 基因 序列
3
基于大语言模型的智能体及其精准题目举一反三的推荐方法
题目推荐方法 大语言模型 知识点 学生学习状态 标签
4
基于改进蜣螂优化算法的SD-MANET覆盖优化方法
覆盖优化方法 位置更新 切比雪夫 算法 监测点
5
一种云端智能图像处理系统及其应用方法
高频特征 智能图像处理系统 多模态特征 智能图像处理方法 序列
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号