大语言模型的连续前缀微调方法、装置、设备及介质

正文

推荐专利

申请号：CN202410992146

申请日期：2024-07-23

公开号：CN119026688A

公开日期：2024-11-26

类型：发明专利

摘要

本公开涉及一种大语言模型的连续前缀微调方法、装置、设备及介质，尤其涉及人工智能技术领域。通过获取词元序列和微调数据集合，并对微调数据集合采样得到采样数据，构建变分自动编码器的编码器链路和解码器链路，再构建变分自动编码器训练的目标函数，循环运行两阶段坐标优化直到多层感知器参数和权重混合参数收敛得到微调后的大语言模型。本公开实施例是将变分自动编码器和大语言模型联合起来优化迭代，降低了大语言模型的训练成本。

技术关键词

变分自动编码器多层感知器微调方法大语言模型解码器链路参数两阶段计算机程序产品上存储计算机程序后文数据处理器可读存储介质人工智能技术微调装置坐标集束

系统为您推荐了相关专利信息

基于大语言模型的车辆行驶轨迹预测方法

大语言模型重编程适配器场景特征编码特征

一种多步态控制器生成方法、控制器及四足机器人

控制器生成方法四足机器人仿真环境关节电机指令

一种电力行业智能问答多知识库分类优化方法及其系统

电力行业智能分类优化方法大语言模型案例库分类准确率

一种动车组垂直领域智能应用平台及使用方法

动车组故障大语言模型专业知识库数据平台

一种基于大语言模型的代码驱动具身智能体的后门攻击链方法

后门大语言模型视觉触发器生成对抗网络有效性

大语言模型的连续前缀微调方法、装置、设备及介质

站点导航

APP 下载