摘要
本发明涉及计算机人工智能技术领域,具体涉及一种基于DRL和BP的移动边缘网络协同推理方法,提出了一种大语言模型中的边缘‑终端协同推理方案,充分利用了终端设备和边缘服务器的计算能力,同时在一定程度上保护了用户的数据隐私,在资源有限的情况下,通过利用“学习以学习”范式联合解决了推理任务卸载和模型缓存问题。使用深度强化学习选择轻量级、高流行度的模型缓存到边缘服务器,并采用分布式信念传播技术解决相关的推理任务卸载问题。数值结果证明了所提出方案的有效性和优越性。借助边缘终端协作,可以提高LLM推理中的通信和计算资源利用率。换句话说,通过有效的小型模型缓存和推理任务卸载,可以有效地完成多样化的推理请求。
技术关键词
推理方法
终端设备
大语言模型
网络
计算机人工智能技术
服务器
决策
计算资源受限
定义
深度强化学习
变量
建立通信
资源分配
基站
参数
有效性
时延
内存
系统为您推荐了相关专利信息
PCB板检测设备
分析测试设备
PCB板上元器件
数据存储模块
焊点
要素抽取方法
表单
OCR识别技术
基金
深度学习技术
场景生成方法
条件生成对抗网络
生成框架
电压越限风险
综合风险指标
病变识别方法
糖尿病肾病
病变识别模型
注意力模型
光学相干断层图像