基于低秩自适应矩阵和混合专家的多领域问答任务微调方法

正文

推荐专利

申请号：CN202411700335

申请日期：2024-11-25

公开号：CN119537554B

公开日期：2025-12-09

类型：发明专利

摘要

本发明属于自然语言处理与参数高效微调领域，具体涉及一种基于低秩自适应矩阵和混合专家的多领域问答任务微调方法，该方法包括：加载数据集并划分；使用句向量模型抽取数据集句向量表示，对句向量使用K均值聚类算法获得类别数N；加载预训练语言模型，冻结原模型参数；在模型中指定的结构旁构建N个非对称的低秩专家模块以及路由模块；将句向量表示作为路由模块输入，路由模块计算专家权重并将不同专家加权求和；所述多领域问答任务微调方法包括低秩自适应矩阵以及混合专家模块；本发明利用低秩自适应矩阵显著降低可训练参数数量，提高训练效率；使用混合专家模块，学习复杂问答任务中不同领域问题的专有知识，提高模型的泛化能力。

技术关键词

微调方法矩阵 K均值聚类算法样本模块预训练语言模型最佳聚类数目参数预训练模型 Softmax函数模型库数据 K均值算法训练集网络结构答案自然语言

系统为您推荐了相关专利信息

基于多通道细胞协同分割架构的IMC图像分割方法

图像分割方法多通道信号特征双向变换器解码模块

基于多源数据分析的客户订单智能排产系统

智能排产系统产品生产线数据处理模块矩阵客户

视频文案生成方法、装置、设备和存储介质

视频营销大语言模型样本摘要文案生成方法

基于多模态特征与域自适应的水下目标检测方法

多模态特征声呐融合特征表达式注意力

多机器人场景下导航规划方法、装置、机器人及存储介质

导航规划方法机器人场景地图运动时间段

基于低秩自适应矩阵和混合专家的多领域问答任务微调方法

站点导航

APP 下载