一种任务调度方法、装置、中心服务器及存储介质

正文

推荐专利

申请号：CN202510682708

申请日期：2025-05-26

公开号：CN120704859A

公开日期：2025-09-26

类型：发明专利

摘要

本发明实施例提供了一种任务调度方法、装置、中心服务器及存储介质，涉及大语言模型技术领域。方法包括：获取待预填充文本单元的第一数目；计算目标处理结果的文本单元的预测数目与已生成文本单元的数目的差值，得到第二数目；从各执行服务器中确定备选执行服务器；针对每一备选执行服务器，基于第一数目和第二数目，预测该备选执行服务器所需的时长；基于各备选执行服务器所需的时长，从各备选执行服务器中确定目标执行服务器，并向目标执行服务器发送待处理文本，以使目标执行服务器基于大语言模型，使用目标执行服务器当前可用的目标资源对待处理文本进行处理，可以均衡使用服务器的计算资源和存读资源。

技术关键词

文本大语言模型任务调度方法阶段中心服务器资源解码任务调度装置通信接口可读存储介质存储器处理器数据迁移样本模块字符计算机编码

系统为您推荐了相关专利信息

使用扩散模型监督视觉语言模型训练的方法

交叉注意力机制线性变换矩阵视觉适配器 Softmax函数

基于多阶段贝叶斯优化的模拟集成电路测试激励生成方法

模拟集成电路测试激励生成方法组合故障多阶段拉丁超立方采样

一种基于信任度的用户分配方法、装置、设备及介质

服务交互数据信任度模型语音计算机可读指令文本

基于异质特征联合学习的数显仪表识读处理方法及系统

特征联合学习卷积特征数显仪表读数文本识别模型模糊推理

基于强化学习的多模态大模型任务处理方法、装置及设备

视觉策略更新格式多模态数据分布

一种任务调度方法、装置、中心服务器及存储介质

站点导航

APP 下载