摘要
本发明公开了一种面向下游任务的LLM投机解码优化方法及系统,方法包括以下步骤:构建多个面向不同任务的对齐数据集,并利用对齐数据集构建异质草稿模型池;获取下游任务的提示词文本,利用任务分类机制基于提示词文本对输入的任务进行分类,得到分类结果;根据分类结果从异质草稿模型池中选取最优的草稿模型;利用选出的草稿模型生成猜测tokens序列,并将猜测tokens序列输入至目标模型中进行并行验证,完成投机解码优化。本发明不仅提升了大规模预训练语言模型在不同任务下的推理性能,还通过微调与任务分类的结合,增强了模型在面对多样化任务时的适应能力。
技术关键词
异质
解码
分类机制
分类模型训练
文本分类模型
数据
小规模
序列
预训练语言模型
模块
处理单元
系统为您推荐了相关专利信息
时序预测模型
变量
BP模型
数据采集系统
加密传输机制
组合导航系统
卡尔曼滤波估计
姿态误差
加速度计误差
观测噪声
动态障碍物
点云数据预处理
环境感知传感器
可见光相机
像素点