大语言模型的连续前缀微调方法、装置、设备及介质

AITNT
正文
推荐专利
大语言模型的连续前缀微调方法、装置、设备及介质
申请号:CN202410992146
申请日期:2024-07-23
公开号:CN119026688A
公开日期:2024-11-26
类型:发明专利
摘要
本公开涉及一种大语言模型的连续前缀微调方法、装置、设备及介质,尤其涉及人工智能技术领域。通过获取词元序列和微调数据集合,并对微调数据集合采样得到采样数据,构建变分自动编码器的编码器链路和解码器链路,再构建变分自动编码器训练的目标函数,循环运行两阶段坐标优化直到多层感知器参数和权重混合参数收敛得到微调后的大语言模型。本公开实施例是将变分自动编码器和大语言模型联合起来优化迭代,降低了大语言模型的训练成本。
技术关键词
变分自动编码器 多层感知器 微调方法 大语言模型 解码器 链路 参数 两阶段 计算机程序产品 上存储计算机程序 后文 数据 处理器 可读存储介质 人工智能技术 微调装置 坐标 集束
系统为您推荐了相关专利信息
1
基于大语言模型的车辆行驶轨迹预测方法
大语言模型 重编程 适配器 场景特征 编码特征
2
一种多步态控制器生成方法、控制器及四足机器人
控制器生成方法 四足机器人 仿真环境 关节电机 指令
3
一种电力行业智能问答多知识库分类优化方法及其系统
电力行业智能 分类优化方法 大语言模型 案例库 分类准确率
4
一种动车组垂直领域智能应用平台及使用方法
动车组故障 大语言模型 专业知识库 数据 平台
5
一种基于大语言模型的代码驱动具身智能体的后门攻击链方法
后门 大语言模型 视觉触发器 生成对抗网络 有效性
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号