一种基于Inception模块的提示微调方法

AITNT
正文
推荐专利
一种基于Inception模块的提示微调方法
申请号:CN202410891816
申请日期:2024-07-04
公开号:CN118780341A
公开日期:2024-10-15
类型:发明专利
摘要
本发明涉及一种基于Inception模块的提示微调方法,通过将一个用于下游任务的提示网络插入预训练模型内部,该网络包含有随机选取预训练模型词表进行初始化的连续提示,以及与连续提示相连接的多个尺寸递增的带有上下投影的瓶颈网络,其形状类似于Inception模块,起到对单一连续提示向量的深度和宽度进行高效扩充的作用。在针对下游任务微调预训练模型时,冻结主干模型使得仅提示网络可以进行参数更新,因提示网络放置于预训练模型的中后部,在反向传播过程中距离较短任务相关信息损失少,同时优化训练时间和内存占用。
技术关键词
预训练模型 微调方法 投影模块 线性单元 瓶颈 网络 数据 词嵌入向量 答案 编码器 基础 参数 模板 内存 标签 样本 阶段 尺寸
系统为您推荐了相关专利信息
1
基于氨氮浓度预测与水下目标跟踪的水质监测方法
水质监测方法 氨氮 上采样 运动轨迹分析 观测噪声
2
目标检测方法、装置、计算机设备以及存储介质
视频 检索标签 客户端 图框 图片类别
3
一种医疗器械生产控制方法、装置、终端设备及存储介质
瓶颈 参数 医疗器械 皮尔逊相关系数 负荷
4
一种电子病历真实性鉴定方法及系统
电子病历 重构误差 编码器 超参数 计算机可读指令
5
基于射线投影的顶头表面缺陷检测方法及系统
表面缺陷检测方法 射线 表面缺陷检测系统 顶头 点云
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号