摘要
本申请公开了一种数据处理,涉及基于路由技术的大语言模型高效混合推理方法、设备及存储介质技术领域,所述基于路由技术的大语言模型高效混合推理包括:若接收到用户请求,确定所述用户请求与缓存库中各历史请求之间的相似度;若不存在所述相似度超过相似度阈值,基于准确率评分模型确定各待选处理模型的评分指标,所述评分指标包括准确率、响应时间以及接口费用;根据所述评分指标确定各所述待选处理模型的综合得分;根据所述综合得分于各所述待选处理模型中选取目标模型,并将所述用户请求路由至所述目标模型。本申请达成了优化大语言模型的选择以实现用户请求的高效响应的技术效果。
技术关键词
推理方法
存储介质技术
指标
数据
大语言模型
接口
分词
处理器
可读存储介质
存储器
计算机
标签
算法
参数
压力
系统为您推荐了相关专利信息
噪声指数
序列
高精度电流传感器
监测开关电源
智能决策系统
数字孪生模型
爆破机器人
分布特征
爆破开挖方法
开挖设备
电力系统
可平移负荷
集群
设备运行状态
关断周期