大语言模型中慢思考与快速响应区域的解耦方法及装置

AITNT
正文
推荐专利
大语言模型中慢思考与快速响应区域的解耦方法及装置
申请号:CN202510882807
申请日期:2025-06-28
公开号:CN120764686A
公开日期:2025-10-10
类型:发明专利
摘要
本发明公开了一种大语言模型中慢思考与快速响应区域的解耦方法及装置。其中,该方法包括:构造慢思考提示和快响应提示,将慢思考提示和快响应提示分别输入大语言模型,并记录大语言模型的每一线性层的神经元激活值;基于慢思考提示和快响应提示分别对应的神经元激活值,计算激活值差向量,并基于激活值差向量获取提示差向量;迭代处理多个推理问题,获取所有推理问题中的提示差向量的正值位置交集,识别出与慢思考相关的关键神经元集合;基于关键神经元集合中的关键神经元的位置信息,构建梯度掩码矩阵,基于梯度掩码矩阵采用掩码方式对关键神经元进行微调,得到优化后的大语言模型。本发明解决了现有模型推理能力不佳的技术问题。
技术关键词
大语言模型 掩码矩阵 可读存储介质 计算机程序产品 处理器 存储器 线性 计算机设备 识别模块 强度 索引 样本 动态
系统为您推荐了相关专利信息
1
一种光伏设备智能监测及故障诊断方法及相关装置
故障诊断模型 光伏设备 故障诊断方法 判断环境状态 光伏阵列输出功率
2
基于反馈与自纠正的故障诊断暖通大语言模型训练方法
暖通空调系统 大语言模型 故障检测诊断 故障类别 数据
3
广告内容的推送方法、装置、计算机设备和存储介质
策略 多臂老虎机 个性化广告 训练神经网络模型 数据
4
一种基于群智协同的水声传感网络控制系统及控制方法
水声传感网络 环境感知信息 特征提取模块 通信模块 主控板
5
车辆检测方法、装置、电子设备及存储介质
训练检测模型 管理系统控制 车辆检测方法 图片 生成检测模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号