摘要
本发明涉及一种基于Inception模块的提示微调方法,通过将一个用于下游任务的提示网络插入预训练模型内部,该网络包含有随机选取预训练模型词表进行初始化的连续提示,以及与连续提示相连接的多个尺寸递增的带有上下投影的瓶颈网络,其形状类似于Inception模块,起到对单一连续提示向量的深度和宽度进行高效扩充的作用。在针对下游任务微调预训练模型时,冻结主干模型使得仅提示网络可以进行参数更新,因提示网络放置于预训练模型的中后部,在反向传播过程中距离较短任务相关信息损失少,同时优化训练时间和内存占用。
技术关键词
预训练模型
微调方法
投影模块
线性单元
瓶颈
网络
数据
词嵌入向量
答案
编码器
基础
参数
模板
内存
标签
样本
阶段
尺寸
系统为您推荐了相关专利信息
水质监测方法
氨氮
上采样
运动轨迹分析
观测噪声
电子病历
重构误差
编码器
超参数
计算机可读指令
表面缺陷检测方法
射线
表面缺陷检测系统
顶头
点云