基于层次混合专家模型的大模型多偏好对齐方法及装置

正文

推荐专利

申请号：CN202510340570

申请日期：2025-03-21

公开号：CN119862423B

公开日期：2025-06-17

类型：发明专利

摘要

本发明提供基于层次混合专家模型的大模型多偏好对齐方法及装置，涉及自然语言处理技术领域。该方法包括：获取预训练的单目标微调模型；提取模型中每个单目标策略的目标向量，通过任务向量奇异值分解法分解目标向量，生成低秩适配器作为每个单目标的LoRA专家；采用PCB‑merging和Free‑merging融合模型进行处理，获得多目标LoRA专家；生成线性路由层，构造奖励损失函数；采用镜像梯度下降和平滑切比雪夫标量化对损失函数进行优化，获得多目标的路由专家；设计权重路由器；根据多目标LoRA专家、多目标的路由专家和权重路由器，构建层次化的混合专家模型；将获取的用户输入的提示词和偏好向量，输入层次化的混合专家模型中，输出符合用户的偏好。采用本发明可提高推理效率。

技术关键词

对齐方法计算机可读取存储介质路由器切比雪夫奇异值分解法适配器计算机可读指令对齐设备对齐装置线性镜像策略预训练模型参数自然语言处理器存储器矩阵动态定义

系统为您推荐了相关专利信息

一种多设备共享WiFi网络优化方法及系统

智能路由器网络优化方法通信设备服务器接入WiFi网络

数据中心互联网出口架构

负载均衡设备二层交换机网关设备防护设备数据中心

NUMA感知输出接口选择

网络接口消息机器可读介质逻辑路由器逻辑交换机

数据传输方法、装置及虚拟通道路由器

数据传输方法路由器非易失性计算机可读存储介质数据传输装置计算机程序指令

一种无人机辅助的多任务并行执行的边缘计算方法及装置

移动设备无人机边缘计算方法深度Q网络神经网络参数

基于层次混合专家模型的大模型多偏好对齐方法及装置

站点导航

APP 下载