一种大语言模型训练方法及装置

AITNT
正文
推荐专利
一种大语言模型训练方法及装置
申请号:CN202411810781
申请日期:2024-12-10
公开号:CN119740621A
公开日期:2025-04-01
类型:发明专利
摘要
本申请实施例公开了一种大语言模型训练方法及装置。该方法包括:将全量训练数据输入至大模型中进行训练;确定大模型的大模型性能数据;根据大模型性能数据从全量训练数据中选择至少部分训练数据作为目标训练数据,基于目标训练数据对应的大模型性能数据进行参数优化调整;若不满足预设条件,返回从将全量训练数据输入至大模型中进行训练开始继续执行。上述方案根据大模型性能数据选择出相对优质的训练数据,先基于该部分训练数据对应的大模型性能数据进行参数调优,使模型能够快速优化,模型能力提升的情况下,进一步提升了对其他训练数据的学习能力,继续将全量训练数据输入参与参数优化调整,提高了模型训练效率和泛化能力。
技术关键词
数据 大语言模型 参数 标记 训练装置 模块
系统为您推荐了相关专利信息
1
一种基于电子海图的仿真图像显示方法及系统
海洋信息数据 图像显示方法 偏差 雷达 船舶
2
跟网型变流器暂态过电压抑制控制参数优化方法和系统
电流环参数 暂态过电压 变流器 控制参数优化方法 二阶系统
3
一种基于自动化的运动线缆生产速度智能控制方法及系统
速度智能控制 线缆 订单 设备状态信息 运动
4
一种基于低秩自适应微调LoRA的自适应故障检测方法
故障检测模型 故障类别 样本 故障检测方法 注意力
5
基于多模态增强转换器和超图结构的人体骨骼行为识别方法
骨骼特征 多模态 注意力 人体骨骼 双人
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号