一种基于分布式边缘云的高效大语言模型推理方法

AITNT
正文
推荐专利
一种基于分布式边缘云的高效大语言模型推理方法
申请号:CN202411436438
申请日期:2024-10-15
公开号:CN119248502A
公开日期:2025-01-03
类型:发明专利
摘要
本发明涉及物联网技术领域,尤其涉及一种基于分布式边缘云的高效大语言模型推理方法,包括以下步骤:S1:将用户设备UE和边缘节点EN根据深度优先搜索树分配到包括GPU优先组、内存优先组和混合组的分类群组;S2:马尔可夫决策过程根据训练集得到分裂点,根据分裂点将推理模型进行划分得到划分模型,并将划分模型部署到在分类群组的每一个组中,得到优化模型;S3:将测试集输入到优化模型进行推理得到推理结果。本发明通过将设备进行划分,加快了推理速度;将推理模型进行划分,并部署到在分类群组的每一个组中,降低用户设备的负载。通过将预期贴现回报近似于长期总体目标,实现计算效率的大幅提高,使RL代理能够灵活地适应不断变化的部署环境。
技术关键词
分布式边缘 大语言模型 推理方法 深度优先搜索 计算机可读指令 训练集 参数 策略更新 决策 节点 网络 内存 比率 处理器 静态特征 噪声强度 广义 物联网技术 因子
系统为您推荐了相关专利信息
1
一种投标文件的质量评估方法、装置、设备及存储介质
大语言模型 目录 容器 页面索引 指标
2
选股条件拆分与改写方法及系统
改写方法 因子 大语言模型 文本 改写系统
3
一种全自动无人CT扫描控制方法、存储介质及电子设备
注意力 预训练模型 人体关节点 高维特征向量 大语言模型
4
基于大语言模型的多智能体数据分析方法、系统、计算机及介质
数据分析方法 大语言模型 矩阵 数据分析系统 协同算法
5
一种信息熵引导的投机推理方法及相关装置
令牌 信息熵 推理方法 序列 滑动窗口
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号