大语言模型的遗忘更新方法、装置、设备、存储介质和程序产品

AITNT
正文
推荐专利
大语言模型的遗忘更新方法、装置、设备、存储介质和程序产品
申请号:CN202510285077
申请日期:2025-03-11
公开号:CN120180128A
公开日期:2025-06-20
类型:发明专利
摘要
本申请涉及一种大语言模型的遗忘更新方法、装置、设备、存储介质和程序产品。所述方法包括:确定待更新模型,以及获取待更新模型的部分参数、保留数据集和删除数据集,将待更新模型的部分参数、待更新模型、保留数据集和删除数据集,输入至预设的遗忘理论模型进行评估,得到部分参数对待更新模型中各结构的第一重要性程度,将部分参数对待更新模型中各结构的第一重要性程度,输入至结构优化模型中进行模型优化,得到优化后的模型;保留数据集中包括对训练样本数据集进行异常数据删除后的数据集;训练样本数据集是指训练待更新模型时使用的数据集;删除数据集是指异常数据构成的数据集。上述方法降低了遗忘处理所需的时间成本和计算开销。
技术关键词
训练样本数据 异常数据 参数 更新方法 理论 大语言模型 凸优化技术 策略 计算机程序产品 处理器 计算机设备 可读存储介质 存储器 数值 模块 关系
系统为您推荐了相关专利信息
1
一种光伏储能系统的充放电控制方法、产品、设备及介质
光伏储能系统 充放电控制方法 充放电策略 时间段 电池组
2
一种基于三维目标检测的防碰撞方法和系统
碰撞方法 对象 图像分割模型 像素 点云
3
一种大学校园景观的视觉健康评估方法、系统及设备
健康评估方法 景观 视觉 深度学习模型 融合特征
4
基于光学遥感数据和数字高程模型的山前水系提取方法
光学遥感数据 数字高程模型数据 水体 指数 因子
5
一种基于横截面面积的三维飞行器气动外形特征构造及气动力预测方法
飞行器气动外形 横截面面积 气动力 三维飞行器 工况特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号