生成低秩适配器参数的超网络训练方法及装置

AITNT
正文
推荐专利
生成低秩适配器参数的超网络训练方法及装置
申请号:CN202411501656
申请日期:2024-10-25
公开号:CN119474725A
公开日期:2025-02-18
类型:发明专利
摘要
本公开实施例公开了一种生成低秩适配器参数的超网络训练方法及装置,其中方法包括获取作为输入信息的多任务指令数据,并基于所述输入信息生成低秩适应参数;基于超网络的底层模型对所述输入信息处理后的数据、以及所述低秩适应参数对超网络进行优化;其中,所述多任务指令数据中的任务示例基于梯度的影响估计自动选择得到;训练目标为真值引导的训练目标。通过包含一个文本编码器和一个参数生成器,在多任务遵循指令数据上的超网络预训练以及使用稀疏任务数据的泛化微调;约束训练损失和自动示例选择策略,提高训练稳定性和性能。
技术关键词
网络训练方法 文本编码器 适配器 多任务 超网络 信息处理 k均值聚类算法 指令 多层感知机 网络训练装置 数据 训练语言模型 计算机 可读存储介质 代表 解码器 生成参数
系统为您推荐了相关专利信息
1
芯片测试系统、方法及装置
嵌入式测试装置 芯片测试系统 内存压力测试 待测芯片 存储测试程序
2
一种设置有硬货箱的飞行器货舱
飞行器货舱 货箱 舱体 接口装置 释放装置
3
一种异质集成电路封装结构
异质集成电路 封装主体 封装结构 插针 弹性件
4
一种主题引导的胸部影像诊断报告生成方法与系统
影像诊断报告 局部视觉特征 全局视觉特征 生成方法 生成主题
5
基于对比学习的质谱成像离子图像多任务分析方法及装置
离子 质谱成像数据 多任务 投影特征 投影模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号