摘要
本申请实施例提供了一种大语言模型的调度方法、装置、电子设备、可读介质及计算机程序,该方法包括:接收至少一个任务请求,其中,所述任务请求中携带有需求信息;对于每个所述任务请求,基于多个大语言模型中每个大语言模型执行所述任务请求的目标准确率、延迟及成本,从所述多个大语言模型中选择一个满足所述任务请求中携带的所述需求信息且成本最低的目标模型,其中,不同所述大语言模型的参数量不相同,所述成本用于指示所述大语言模型执行所述任务请求的计算量;将所述任务请求分配给所述目标模型执行。
技术关键词
大语言模型
批量
电子设备
计算机程序产品
调度装置
可读存储介质
指令
处理器
模块
存储器
系统为您推荐了相关专利信息
驾驶路径规划方法
障碍物
移动车辆
网格地图
节点
问答系统构建方法
生成答案
文本
计算机程序代码
节点
视频数据压缩方法
光流算法
编码特征
峰值信噪比
文本