一种大语言模型服务请求调度方法及系统

正文

推荐专利

一种大语言模型服务请求调度方法及系统

申请号：CN202510029675

申请日期：2025-01-08

公开号：CN119960939A

公开日期：2025-05-09

类型：发明专利

摘要

本发明提出了一种大语言模型服务请求调度方法及系统，属于大语言模型与服务计算技术领域；通过构建指令微调数据集对大语言模型进行微调并预测响应文本长度，构建微调后的大语言模型响应时间与响应文本长度之间的关系模型，以得到响应时间近似解；将大语言模型的服务请求进行分批处理并设置分批调度策略；引入误差处理机制，将预测的响应文本长度与大语言模型在接收到服务请求后所输出的响应文本长度进行对比，根据对比结果确定大语言模型的服务响应状态。本发明能够在保证对服务响应时间进行精准预测的基础上，充分利用服务响应过程中的任务特征，以实现对大语言模型服务响应的有效、有序调度。

技术关键词

大语言模型请求调度方法文本策略服务计算技术标识符指令数据参数关系处理器调度系统程序机制模块误差可读存储介质基础存储器电子设备

系统为您推荐了相关专利信息

基于强化学习的纵向联邦隐私保护方法、装置及电子设备

隐私保护方法强化学习策略服务器客户端估计方法

一种基于人工智能的碳排放优化控制系统

排放量优化控制系统企业智能模块控制单元

基于海洋大气参量协同反演策略的偏振大气校正方法、装置、设备及介质

大气校正方法散射光海洋模块水下光场矩阵

融合时序空间特征提取与强化学习的电机缺陷识别方法

缺陷识别方法双网络架构空间特征提取拓扑结构特征策略

表格的信息提取方法、计算机程序产品和信息提取系统

合并单元格训练识别模型信息提取方法信息提取系统监测系统

一种大语言模型服务请求调度方法及系统

站点导航

APP 下载