大语言模型的遗忘学习方法及装置

正文

推荐专利

大语言模型的遗忘学习方法及装置

申请号：CN202510940757

申请日期：2025-07-08

公开号：CN120911530A

公开日期：2025-11-07

类型：发明专利

摘要

本说明书实施例披露一种大语言模型的遗忘学习方法及装置。该方法包括：首先，获取第一大语言模型和遗忘样本集，其中第一大语言模型初始为采用微调样本集进行微调而得到的微调模型，遗忘样本集为微调样本集的子集。接着，针对任意的第一遗忘样本，基于第二大语言模型确定若干相似样本，其中各个相似样本与所述第一遗忘样本具有相似语义但表述不同。之后，利用第一大语言模型处理第一遗忘样本得到第一隐层表征。然后，确定训练损失，其负相关于第一隐层表征与各个相似样本的隐层表征之间的距离，正相关于第一隐层表征和随机向量之间的距离，其中各个相似样本的隐层表征基于微调模型而得到；之后，利用训练损失训练第一大语言模型以实现遗忘学习。

技术关键词

大语言模型样本学习方法聚类算法编码向量模型训练模块学习装置数据获取模块语义计算机度量可读存储介质存储器处理器

系统为您推荐了相关专利信息

基于YOLOv8m和ShuffleNetv2网络的小麦仓储粮虫检测方法

构建小麦注意力机制数据卷积模块神经网络训练

基于跨模态量测数据融合的实时线损分析方法及系统

线损分析方法隔离森林算法跨模态多源异构数据样本

一种基于精准控制的OLED显示屏视效优化方法及系统

OLED显示屏监测点参数彩色亮度计监测设备

基于人工智能的故障识别和处理方法、装置、设备及介质

智能机器人大语言模型音频场景文本

高压交流海缆系统海缆接地故障测距方法、系统及介质

接地故障测距方法海缆系统故障行波零序电压互感器小波神经网络

大语言模型的遗忘学习方法及装置

站点导航

APP 下载