摘要
本申请公开了一种AI大模型智能路由与动态编排方法、系统、设备与介质。该方法包括响应于输入请求,对输入请求进行多维度的特征提取,得到请求特征向量;获取各AI大模型的实时状态和元数据,将请求特征向量以及各AI大模型的实时状态和元数据输入多目标优化模型,得到输入请求对应的候选模型组合;根据动态编排模板,确定候选模型组合中各AI大模型的调用顺序和数据依赖关系,生成候选模型组合的执行计划;将输入请求适配并发送给候选模型组合,基于执行计划调用候选模型组合中的各AI大模型,得到执行结果并返回请求终端。通过上述方式,本申请能够智能的选择候选模型组合,提升了模型选择的准确性和效率,并灵活编排多个候选模型完成复杂任务。
技术关键词
编排方法
数据依赖关系
动态
资源库
融合策略
预训练语言模型
计划
复杂度
画像
终端
意图
分析模块
编排系统
模板
决策
统计特征
处理器
计算机设备