一种大语言模型训练、推理方法及装置

AITNT
正文
推荐专利
一种大语言模型训练、推理方法及装置
申请号:CN202411470415
申请日期:2024-10-21
公开号:CN119312863B
公开日期:2025-11-25
类型:发明专利
摘要
本发明公开了一种大语言模型训练、推理方法及装置。所述大语言模型训练方法包括:获取训练数据集;其中,所述训练数据集中包含至少两个训练样本数据组,每个所述训练样本数据组由对应的至少两种数据组成;从所述训练数据集中按照预设次序或随机抽取至少一个第一训练样本数据组,并从所述第一训练样本数据组中随机剔除至少部分数据,生成目标训练数据;基于所述训练数据集中的所述训练样本数据组和所述目标训练数据对大语言模型进行模型训练,直至满足预设训练条件,生成目标模型。本方案不仅能够使得大语言模型在面对输入数据存在遗漏或缺失时,依然能够输出正确的推理结果,提高了大语言模型的适用性,而且在正常输入数据时输出结果更为稳定。
技术关键词
训练样本数据 编码向量 大语言模型 推理方法 数据获取模块 音乐 训练装置
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号