摘要
本发明提出了一种面向大模型服务的任务并行处理智能调度方法及系统,属于服务计算技术领域,包括:采用LaBSE模型对并行子任务的指令和文本提取语义特征并生成嵌入向量,并通过压缩模块降低嵌入向量的向量维度,将压缩后的嵌入向量输入回归器中预测生成长度;构建基于语义完整性约束的分割算法,将文本分割形成文本片段列表;采用多约束的任务分批算法,根据长度相近约束和同一指令约束,将文本片段列表中分割好的文本片段分到不同批次的任务,得到批任务集合;采用面向异构资源的任务分配算法优化批任务集合,确定优化后的子任务调度方案。本发明实现大模型服务的高效并行处理,显著提升了推理速度、资源利用率和任务调度的智能化水平。
技术关键词
智能调度方法
文本
面向异构资源
任务分配算法
任务调度
列表
分割算法
指令
粒子
语义特征
服务计算技术
智能调度系统
模块
队列
计算机
标记
元素
速度
处理器
系统为您推荐了相关专利信息
风险评估方法
数据安全
多模态
加权融合算法
分时段
分布式智能
协同操作系统
任务分配算法
人机交互模块
机器设备
场景理解方法
场景特征
多视角
大语言模型
视觉特征
实体
更新知识图谱
多智能体协作
构建知识图谱
关系
大语言模型
播放音乐功能
智能人形机器人
文字转语音技术
关键词