大语言模型的调度方法、装置、电子设备、可读介质及计算机程序

AITNT
正文
推荐专利
大语言模型的调度方法、装置、电子设备、可读介质及计算机程序
申请号:CN202510434274
申请日期:2025-04-08
公开号:CN120317370A
公开日期:2025-07-15
类型:发明专利
摘要
本申请实施例提供了一种大语言模型的调度方法、装置、电子设备、可读介质及计算机程序,该方法包括:接收至少一个任务请求,其中,所述任务请求中携带有需求信息;对于每个所述任务请求,基于多个大语言模型中每个大语言模型执行所述任务请求的目标准确率、延迟及成本,从所述多个大语言模型中选择一个满足所述任务请求中携带的所述需求信息且成本最低的目标模型,其中,不同所述大语言模型的参数量不相同,所述成本用于指示所述大语言模型执行所述任务请求的计算量;将所述任务请求分配给所述目标模型执行。
技术关键词
大语言模型 批量 电子设备 计算机程序产品 调度装置 可读存储介质 指令 处理器 模块 存储器
系统为您推荐了相关专利信息
1
一种结构化数据的训练数据筛选方法、装置、设备及介质
数据筛选方法 样本 聚类 数据筛选装置 打标工作
2
翻译方法、装置和词典笔
对象 文本 翻译方法 语义 词典笔
3
驾驶路径规划方法、装置、存储介质及电子设备
驾驶路径规划方法 障碍物 移动车辆 网格地图 节点
4
一种基于文本表征模型与大语言模型结合的FAQ知识库与问答系统构建方法、系统及程序产品
问答系统构建方法 生成答案 文本 计算机程序代码 节点
5
视频数据压缩方法、装置、电子设备及存储介质
视频数据压缩方法 光流算法 编码特征 峰值信噪比 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号