预训练模型的参数微调方法、装置、设备及介质

AITNT
正文
推荐专利
预训练模型的参数微调方法、装置、设备及介质
申请号:CN202411904379
申请日期:2024-12-23
公开号:CN119849576B
公开日期:2025-10-31
类型:发明专利
摘要
公开了一种预训练模型的参数微调方法、装置、设备及介质。参数微调方法基于文本数据集对用于自然语言处理的预训练模型进行参数微调,预训练模型包括具有初始权重矩阵的线性层,所述参数微调方法包括:对线性层施加基于至少一个旋转矩阵的正交变换并根据正交变换获得角度参数矩阵,基于初始权重矩阵和角度参数矩阵来构建正交微调层,将预训练模型中的线性层替换为正交微调层以获得待微调模型;基于文本数据集通过梯度反向传播算法仅更新角度参数矩阵以实现对待微调模型的训练;以及将经训练的待微调模型作为参数微调的结果进行输出。
技术关键词
微调方法 预训练模型 矩阵 参数 正交变换 线性 微调装置 传播算法 自然语言 文本 多层感知机 数据 处理器 输出模块 可读存储介质 注意力 存储器 计算机
系统为您推荐了相关专利信息
1
一种输电通道森林地上生物量扰动分析方法及系统
森林地上生物量 扰动分析方法 光斑 反演模型 数据
2
纳米颗粒光学性质的确定方法
纳米颗粒 三维模型 电磁仿真 三维重构算法 滤波反投影算法
3
基于联邦学习的保护隐私且鲁棒的个性化图像识别方法
图像识别方法 中心服务器 标签类别 保护用户隐私 随机梯度下降
4
基于图像分析的SMT缺陷诊断与改进方法及系统
特征提取模型 分类器模型 周期 位置更新 解码参数
5
一种通信系统中的密钥生成方法及系统
密钥生成方法 通信系统 信道估计值 特征值 信道算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号