摘要
本发明公开了一种大语言模型中慢思考与快速响应区域的解耦方法及装置。其中,该方法包括:构造慢思考提示和快响应提示,将慢思考提示和快响应提示分别输入大语言模型,并记录大语言模型的每一线性层的神经元激活值;基于慢思考提示和快响应提示分别对应的神经元激活值,计算激活值差向量,并基于激活值差向量获取提示差向量;迭代处理多个推理问题,获取所有推理问题中的提示差向量的正值位置交集,识别出与慢思考相关的关键神经元集合;基于关键神经元集合中的关键神经元的位置信息,构建梯度掩码矩阵,基于梯度掩码矩阵采用掩码方式对关键神经元进行微调,得到优化后的大语言模型。本发明解决了现有模型推理能力不佳的技术问题。
技术关键词
大语言模型
掩码矩阵
可读存储介质
计算机程序产品
处理器
存储器
线性
计算机设备
识别模块
强度
索引
样本
动态
系统为您推荐了相关专利信息
故障诊断模型
光伏设备
故障诊断方法
判断环境状态
光伏阵列输出功率
暖通空调系统
大语言模型
故障检测诊断
故障类别
数据
策略
多臂老虎机
个性化广告
训练神经网络模型
数据
水声传感网络
环境感知信息
特征提取模块
通信模块
主控板
训练检测模型
管理系统控制
车辆检测方法
图片
生成检测模型