大型语言模型的训练方法、系统、设备及存储介质

AITNT
正文
推荐专利
大型语言模型的训练方法、系统、设备及存储介质
申请号:CN202510026862
申请日期:2025-01-08
公开号:CN119416853B
公开日期:2025-06-24
类型:发明专利
摘要
本发明涉及人工智能技术领域,具体提供一种大型语言模型的训练方法、系统、设备及存储介质,包括:基于任务难度和任务多样性需求采集任务样本;获取任务样本的支持集和查询集,并对支持集进行数据增强处理;利用支持集对元模型进行内循环训练,并利用查询集对经过内循环训练的元模型进行外循环训练,得到元梯度;汇总元梯度,利用自适应优化器基于元梯度汇总数据更新全局模型。本发明提升了大型语言模型对任务类型的适应能力。
技术关键词
数据更新 优化器 代表 样本 词语 可读存储介质 人工智能技术 训练设备 训练系统 采样模块 程序 同义词 计算方法 参数 处理器 偏差 频率 文本
系统为您推荐了相关专利信息
1
融合数字孪生与图像智能识别的实测实量机器人控制方法
实测实量 机器人控制方法 图像智能识别 全景相机 数字孪生
2
基于用户感知的移动网络评价方法及系统
数据 移动网络 指标 评价方法 栅格系统
3
任务绩效确定方法、装置、电子设备及存储介质
状态估计模型 错误率 评价量表 支持向量机模型 负荷
4
一种基于卷积神经网络的医疗辅助诊断方法及系统
医疗辅助诊断方法 卷积神经网络模型 医学影像数据 电子病历 正则化方法
5
一种基于数据驱动的去中心化距离相关性网络构建算法
构建算法 结点 肺癌 分子 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号