生成低秩适配器参数的超网络训练方法及装置

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI专利库 AI需求对接 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
正文
推荐专利
生成低秩适配器参数的超网络训练方法及装置
申请号:CN202411501656
申请日期:2024-10-25
公开号:CN119474725A
公开日期:2025-02-18
类型:发明专利
摘要
本公开实施例公开了一种生成低秩适配器参数的超网络训练方法及装置,其中方法包括获取作为输入信息的多任务指令数据,并基于所述输入信息生成低秩适应参数;基于超网络的底层模型对所述输入信息处理后的数据、以及所述低秩适应参数对超网络进行优化;其中,所述多任务指令数据中的任务示例基于梯度的影响估计自动选择得到;训练目标为真值引导的训练目标。通过包含一个文本编码器和一个参数生成器,在多任务遵循指令数据上的超网络预训练以及使用稀疏任务数据的泛化微调;约束训练损失和自动示例选择策略,提高训练稳定性和性能。
技术关键词
网络训练方法 文本编码器 适配器 多任务 超网络 信息处理 k均值聚类算法 指令 多层感知机 网络训练装置 数据 训练语言模型 计算机 可读存储介质 代表 解码器 生成参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号