面向移动端深度学习推理的CPU-GPU协同执行方法及系统

AITNT
正文
推荐专利
面向移动端深度学习推理的CPU-GPU协同执行方法及系统
申请号:CN202510629216
申请日期:2025-05-16
公开号:CN120579626A
公开日期:2025-09-02
类型:发明专利
摘要
本发明涉及移动终端数据处理技术领域,尤其涉及一种面向移动端深度学习推理任务的CPU‑GPU双核心协同执行方法及系统。所述方法在线下阶段,对目标深度学习模型进行结构分析,并结合硬件特性预测每个算子的执行时间和数据传输开销;在在线阶段,任务调度器和异构执行引擎两个关键模块通过创新的动态调度和资源管理技术,确保高效的CPU与GPU协同执行。通过将推理任务动态分配至CPU和GPU,灵活协同调度,充分发挥各处理器的计算优势,显著提升了整体利用率,避免了单一计算资源的空闲或瓶颈。面对移动端等资源受限场景,系统通过双缓冲结构、数据复用和并发执行策略,优化内存使用效率,提升任务执行的并发度和稳定性,实现高效推理性能。
技术关键词
深度学习模型 移动端 移动终端数据处理技术 分区策略 线下 数据传输开销 双缓冲结构 资源管理技术 在线 处理器 异构 动态 双核心 流水线 队列 任务调度 跨设备 滑动窗口 数据格式
系统为您推荐了相关专利信息
1
基于时空语义融合的大遗址智能修复与数字资产管理系统
数字资产管理系统 语义 条件生成对抗网络 时空数据模型 数据采集模块
2
多模态数据驱动的配电网设备状态评估与优化方法
配电网设备状态 同步算法 动态时间规整算法 强化学习算法 设备状态评估
3
一种基于MBSE的电工装备电磁场有限元仿真方法
有限元仿真软件 有限元仿真方法 螺线管 深度学习模型 软件架构
4
利用声学时差法在河道近河底流量计算方法及系统
流速 声道 流量计算方法 河道断面 测流断面
5
一种优化生成唇形驱动视频效果的方法、装置及存储介质
视频 计算机可执行程序 语音 深度学习模型训练 计算机可读记录介质
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号