摘要
本发明涉及边缘计算及大模型推理优化技术领域,提供了基于Multi‑Armed Bandit的边缘设备大模型在线缓存与服务系统,系统包括:特征信息接收模块,用于接收云端备选LLM的特征信息集合;LLM质量预测模块,用于基于特征信息集合,使用神经网络对每个LLM预测效用向量并计算UCB值和效用偏移量;边缘排序选择模块,用于对UCB值和效用偏移量之和降序排序,选择预设个数的LLM生成LLM子集并将所述LLM子集缓存后部署到边缘端;异步处理输出训练模块,用于收集服务质量数据和神经网络梯度数据,并异步地对LLM质量预测模块中的神经网络模型进行训练和参数优化更新;不断重复以上步骤实现基于Multi‑Armed Bandit的边缘设备大模型在线缓存与服务。
技术关键词
多臂赌博机
神经网络模型
服务质量数据
服务系统
服务质量评估
协方差矩阵
在线
信息接收模块
子模块
云端
服务器设备
正则化参数
多任务
信号
基线
系统为您推荐了相关专利信息
智慧城市用户平台
聊天机器人
智慧城市服务平台
智慧城市服务系统
情绪特征
大数据采集分析
咨询服务系统
生成决策建议
数据采集模块
数据存储模块
生长预测方法
递归神经网络模型
深度学习特征
动态
数据