一种基于边缘设备的大模型运行方法、装置、设备及介质

正文

推荐专利

申请号：CN202510668615

申请日期：2025-05-23

公开号：CN120196449B

公开日期：2025-08-26

类型：发明专利

摘要

本申请公开了一种基于边缘设备的大模型运行方法、装置、设备及介质，涉及人工智能技术领域，包括：对待运行大模型进行预处理，并基于边缘设备的硬件特性对预处理后的待运行大模型进行优化；基于当前边缘设备的资源情况，确定优化后模型对应的待执行任务的任务优先级；根据任务优先级将待执行任务分配至预先搭建的模型协同运行框架中，并在分配的过程中，对待执行任务进行分析，以根据分析结果将待执行任务部署至模型协同运行框架的负载均衡节点上；利用预设数据缓存管理算法对相关参数数据进行管理，以将相关参数数据中待使用数据预加载至边缘设备中，以便优化后模型通过模型协同运行框架的负载均衡节点，基于待使用数据执行相应的待执行任务。

技术关键词

负载均衡节点模型运行方法数据缓存管理现场可编程门阵列框架图形处理器数据访问服务器云端数据管理模块稀疏训练方法参数批量数据频率知识蒸馏技术单指令多数据数据缓存单元资源分配

系统为您推荐了相关专利信息

一种电力装备采购投标方案评估方法、装置及设备

联邦模型装备电力机器学习模型时序预测模型

抓取无人机及飞行配送系统

飞控组件自锁机构牵引无人机激光雷达机械臂

一种智能仓储场景下的多机器人弹性调度方法

弹性调度方法智能仓储混合整数规划救援机器人决策

一种基于风格混合重组的人脸反欺骗域泛化方法

组装特征泛化方法风格规范化技术数据处理模型

一种基于延迟感知的自适应分布式训练方法、设备及介质

分布式训练方法时间序列预测模型强化学习框架策略控制器时效性

一种基于边缘设备的大模型运行方法、装置、设备及介质

站点导航

APP 下载