基于路由技术的大语言模型高效混合推理方法、设备及存储介质

AITNT
正文
推荐专利
基于路由技术的大语言模型高效混合推理方法、设备及存储介质
申请号:CN202510450995
申请日期:2025-04-10
公开号:CN119961424B
公开日期:2025-08-12
类型:发明专利
摘要
本申请公开了一种数据处理,涉及基于路由技术的大语言模型高效混合推理方法、设备及存储介质技术领域,所述基于路由技术的大语言模型高效混合推理包括:若接收到用户请求,确定所述用户请求与缓存库中各历史请求之间的相似度;若不存在所述相似度超过相似度阈值,基于准确率评分模型确定各待选处理模型的评分指标,所述评分指标包括准确率、响应时间以及接口费用;根据所述评分指标确定各所述待选处理模型的综合得分;根据所述综合得分于各所述待选处理模型中选取目标模型,并将所述用户请求路由至所述目标模型。本申请达成了优化大语言模型的选择以实现用户请求的高效响应的技术效果。
技术关键词
推理方法 存储介质技术 指标 数据 大语言模型 接口 分词 处理器 可读存储介质 存储器 计算机 标签 算法 参数 压力
系统为您推荐了相关专利信息
1
一种开关电源高边电流检测方法
噪声指数 序列 高精度电流传感器 监测开关电源 智能决策系统
2
一种岩体基坑爆破开挖方法、系统、设备及存储介质
数字孪生模型 爆破机器人 分布特征 爆破开挖方法 开挖设备
3
基于改进YOLOv5s的枣果实检测方法、装置、设备、介质及产品
果实 算法模型 图像 拍摄设备 注意力机制
4
基于数字孪生的电力系统供需平衡控制方法
电力系统 可平移负荷 集群 设备运行状态 关断周期
5
一种融合更长记忆的保持内容一致性智能Agent思考方法
答案 记忆 算法 序列 备份
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号