一种面向大模型服务的任务并行处理智能调度方法及系统

AITNT
正文
推荐专利
一种面向大模型服务的任务并行处理智能调度方法及系统
申请号:CN202510740546
申请日期:2025-06-05
公开号:CN120256068B
公开日期:2025-08-12
类型:发明专利
摘要
本发明提出了一种面向大模型服务的任务并行处理智能调度方法及系统,属于服务计算技术领域,包括:采用LaBSE模型对并行子任务的指令和文本提取语义特征并生成嵌入向量,并通过压缩模块降低嵌入向量的向量维度,将压缩后的嵌入向量输入回归器中预测生成长度;构建基于语义完整性约束的分割算法,将文本分割形成文本片段列表;采用多约束的任务分批算法,根据长度相近约束和同一指令约束,将文本片段列表中分割好的文本片段分到不同批次的任务,得到批任务集合;采用面向异构资源的任务分配算法优化批任务集合,确定优化后的子任务调度方案。本发明实现大模型服务的高效并行处理,显著提升了推理速度、资源利用率和任务调度的智能化水平。
技术关键词
智能调度方法 文本 面向异构资源 任务分配算法 任务调度 列表 分割算法 指令 粒子 语义特征 服务计算技术 智能调度系统 模块 队列 计算机 标记 元素 速度 处理器
系统为您推荐了相关专利信息
1
一种基于多模态大模型构建数据安全风险评估方法、系统及存储介质
风险评估方法 数据安全 多模态 加权融合算法 分时段
2
分布式智能多机协同操作系统、方法、部署装置及设备
分布式智能 协同操作系统 任务分配算法 人机交互模块 机器设备
3
一种基于大语言模型的三维点云场景理解方法及相关产品
场景理解方法 场景特征 多视角 大语言模型 视觉特征
4
基于多智能体协作的多文档智能问答方法、装置、设备
实体 更新知识图谱 多智能体协作 构建知识图谱 关系
5
集成多种大语言模型的多模态人机交互优化系统
大语言模型 播放音乐功能 智能人形机器人 文字转语音技术 关键词
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号