摘要
本公开涉及一种大语言模型的连续前缀微调方法、装置、设备及介质,尤其涉及人工智能技术领域。通过获取词元序列和微调数据集合,并对微调数据集合采样得到采样数据,构建变分自动编码器的编码器链路和解码器链路,再构建变分自动编码器训练的目标函数,循环运行两阶段坐标优化直到多层感知器参数和权重混合参数收敛得到微调后的大语言模型。本公开实施例是将变分自动编码器和大语言模型联合起来优化迭代,降低了大语言模型的训练成本。
技术关键词
变分自动编码器
多层感知器
微调方法
大语言模型
解码器
链路
参数
两阶段
计算机程序产品
上存储计算机程序
后文
数据
处理器
可读存储介质
人工智能技术
微调装置
坐标
集束
系统为您推荐了相关专利信息
控制器生成方法
四足机器人
仿真环境
关节电机
指令
电力行业智能
分类优化方法
大语言模型
案例库
分类准确率
后门
大语言模型
视觉触发器
生成对抗网络
有效性