大语言模型的处理方法、装置、计算机设备、可读存储介质和程序产品

正文

推荐专利

申请号：CN202411700293

申请日期：2024-11-26

公开号：CN119577450A

公开日期：2025-03-07

类型：发明专利

摘要

本申请涉及一种大语言模型的处理方法、装置、设备、存储介质和程序产品，涉及自然语言处理技术领域。本申请能够使得调整后的大语言模型用于扩充风险数据集，也能避免大语言模型原有的生成能力劣化。方法：利用数据对样本识别出大语言模型中的安全激活参数；将多组风险数据输入大语言模型并记录大语言模型处理完成后安全激活参数对应的当前梯度切片；根据当前梯度切片与异常梯度切片之间的相似度，在多组风险数据中识别出有效数据得到数据训练集；根据数据训练集对大语言模型进行低秩微调得到微调参数；基于微调参数和安全激活参数对安全激活参数的原始权重进行更新，根据更新后权重对模型参数进行调整，调整后的大语言模型用于扩充风险数据集。

技术关键词

大语言模型切片参数训练集异常数据样本风险计算机设备识别模块可读存储介质计算机程序产品处理器矩阵自然语言存储器

系统为您推荐了相关专利信息

一种农作物的精细分类方法、装置及介质

分类器样本数据归一化植被指数精细分类方法

基于面部肌肉的电生理评估和电刺激系统、方法及装置

面部肌电采集器刺激系统生理采集电极

连退炉工艺参数确定方法、装置、存储介质及计算机设备

非易失性存储介质控制权关系接触式热电偶参数

一种基于双分支轻量化主干的海底目标检测方法

侧扫声呐图像分支网络无人平台训练集

煤矿安全知识交互方法、交互系统

交互方法大语言模型词模型交互系统自然语言

大语言模型的处理方法、装置、计算机设备、可读存储介质和程序产品

站点导航

APP 下载