基于低秩自适应矩阵和混合专家的多领域问答任务微调方法

AITNT
正文
推荐专利
基于低秩自适应矩阵和混合专家的多领域问答任务微调方法
申请号:CN202411700335
申请日期:2024-11-25
公开号:CN119537554B
公开日期:2025-12-09
类型:发明专利
摘要
本发明属于自然语言处理与参数高效微调领域,具体涉及一种基于低秩自适应矩阵和混合专家的多领域问答任务微调方法,该方法包括:加载数据集并划分;使用句向量模型抽取数据集句向量表示,对句向量使用K均值聚类算法获得类别数N;加载预训练语言模型,冻结原模型参数;在模型中指定的结构旁构建N个非对称的低秩专家模块以及路由模块;将句向量表示作为路由模块输入,路由模块计算专家权重并将不同专家加权求和;所述多领域问答任务微调方法包括低秩自适应矩阵以及混合专家模块;本发明利用低秩自适应矩阵显著降低可训练参数数量,提高训练效率;使用混合专家模块,学习复杂问答任务中不同领域问题的专有知识,提高模型的泛化能力。
技术关键词
微调方法 矩阵 K均值聚类算法 样本 模块 预训练语言模型 最佳聚类数目 参数 预训练模型 Softmax函数 模型库 数据 K均值算法 训练集 网络结构 答案 自然语言
系统为您推荐了相关专利信息
1
基于多通道细胞协同分割架构的IMC图像分割方法
图像分割方法 多通道 信号特征 双向变换器 解码模块
2
基于多源数据分析的客户订单智能排产系统
智能排产系统 产品生产线 数据处理模块 矩阵 客户
3
视频文案生成方法、装置、设备和存储介质
视频营销 大语言模型 样本 摘要 文案生成方法
4
基于多模态特征与域自适应的水下目标检测方法
多模态特征 声呐 融合特征 表达式 注意力
5
多机器人场景下导航规划方法、装置、机器人及存储介质
导航规划方法 机器人场景 地图 运动 时间段
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号