一种面向下游任务的LLM投机解码优化方法及系统

正文

推荐专利

申请号：CN202510098098

申请日期：2025-01-22

公开号：CN120031128A

公开日期：2025-05-23

类型：发明专利

摘要

本发明公开了一种面向下游任务的LLM投机解码优化方法及系统，方法包括以下步骤：构建多个面向不同任务的对齐数据集，并利用对齐数据集构建异质草稿模型池；获取下游任务的提示词文本，利用任务分类机制基于提示词文本对输入的任务进行分类，得到分类结果；根据分类结果从异质草稿模型池中选取最优的草稿模型；利用选出的草稿模型生成猜测tokens序列，并将猜测tokens序列输入至目标模型中进行并行验证，完成投机解码优化。本发明不仅提升了大规模预训练语言模型在不同任务下的推理性能，还通过微调与任务分类的结合，增强了模型在面对多样化任务时的适应能力。

技术关键词

异质解码分类机制分类模型训练文本分类模型数据小规模序列预训练语言模型模块处理单元

系统为您推荐了相关专利信息

基于位置引导病灶表征学习的植物叶片病害严重程度评估方法

程度评估方法语义特征叶片编码器图像

一种轴承振动数据生成方法、装置、设备及存储介质

数据生成方法编码器三元组分类器轴承

一种基于APC的时序预测模型构建方法及系统

时序预测模型变量 BP模型数据采集系统加密传输机制

基于Transformer模型的鲁棒SINS/DVL组合导航方法、系统及设备

组合导航系统卡尔曼滤波估计姿态误差加速度计误差观测噪声

基于聚类原理的无人机道路巡检动态障碍物消障算法

动态障碍物点云数据预处理环境感知传感器可见光相机像素点

一种面向下游任务的LLM投机解码优化方法及系统

站点导航

APP 下载