用于训练隔离路由模型的方法、计算机存储介质、程序产品和设备及混合推理系统

正文

推荐专利

申请号：CN202511415774

申请日期：2025-09-30

公开号：CN120893495A

公开日期：2025-11-04

类型：发明专利

摘要

本发明涉及利用计算机模型的计算机系统，公开了用于训练隔离路由模型的方法、计算机存储介质、程序产品和设备及混合推理系统。一种用于训练隔离路由模型的方法包括：获取训练任务集；获取第一模型通过率和第二模型通过率；基于第一和第二模型通过率生成软标签；由隔离路由模型生成预测结果，其指示训练任务要被路由至第一或第二大语言模型的概率；基于预测结果和软标签确定损失函数；基于损失函数调整隔离路由模型的参数。第一和第二模型通过率分别通过对第一和第二大语言模型执行训练任务的结果进行多次采样而确定。该方法能够高效地训练隔离路由模型，使得能够在多个大语言模型之间精确地对任务进行路由来获得性能与成本之间的平衡。

技术关键词

大语言模型推理系统计算机存储介质标签正确率处理器存储计算机程序计算机程序产品计算机系统存储器参数可读存储介质规模