一种基于神经信号驱动的大语言模型对齐方法及装置

正文

推荐专利

申请号：CN202411001313

申请日期：2024-07-25

公开号：CN119067189A

公开日期：2024-12-03

类型：发明专利

摘要

本发明公开了一种基于神经信号驱动的大语言模型对齐方法及装置，包括：S1.在大语言模型训练阶段，针对特定控制任务构建正面和负面反应样本，作为对比样本集；S2.通过对比样本集从两个方向引导大模型生成方向，定位并获得导致大语言模型产生不同输出行为的神经控制信号，包括正向控制信号和负向控制信号；S3.在大语言模型推理阶段，基于线性子空间假设，通过融合正向控制信号和负向控制信号的特征信号，解耦特征无关信号，提取概念控制信号；S4.利用概念控制信号，对大语言模型施加控制，实现对大模型的神经调控；本发明在维持模型原有生成能力的同时，有效地提高了模型对齐性能，为大模型的可持续性对齐和控制提供了新的视角和工具。

技术关键词

对齐方法大语言模型概念样本注意力参数注意力机制线性阶段对齐装置处理器模块驱动信号矩阵正面可读存储介质存储器代表

一种基于神经信号驱动的大语言模型对齐方法及装置

站点导航

APP 下载