大型语言模型的训练方法、系统、设备及存储介质

正文

推荐专利

申请号：CN202510026862

申请日期：2025-01-08

公开号：CN119416853B

公开日期：2025-06-24

类型：发明专利

摘要

本发明涉及人工智能技术领域，具体提供一种大型语言模型的训练方法、系统、设备及存储介质，包括：基于任务难度和任务多样性需求采集任务样本；获取任务样本的支持集和查询集，并对支持集进行数据增强处理；利用支持集对元模型进行内循环训练，并利用查询集对经过内循环训练的元模型进行外循环训练，得到元梯度；汇总元梯度，利用自适应优化器基于元梯度汇总数据更新全局模型。本发明提升了大型语言模型对任务类型的适应能力。

技术关键词

数据更新优化器代表样本词语可读存储介质人工智能技术训练设备训练系统采样模块程序同义词计算方法参数处理器偏差频率文本

系统为您推荐了相关专利信息

融合数字孪生与图像智能识别的实测实量机器人控制方法

实测实量机器人控制方法图像智能识别全景相机数字孪生

基于用户感知的移动网络评价方法及系统

数据移动网络指标评价方法栅格系统

任务绩效确定方法、装置、电子设备及存储介质

状态估计模型错误率评价量表支持向量机模型负荷

一种基于卷积神经网络的医疗辅助诊断方法及系统

医疗辅助诊断方法卷积神经网络模型医学影像数据电子病历正则化方法

一种基于数据驱动的去中心化距离相关性网络构建算法

构建算法结点肺癌分子样本

大型语言模型的训练方法、系统、设备及存储介质

站点导航

APP 下载