一种并行环境的GPU程序优化方法

AITNT
正文
推荐专利
一种并行环境的GPU程序优化方法
申请号:CN202511543422
申请日期:2025-10-28
公开号:CN121029422A
公开日期:2025-11-28
类型:发明专利
摘要
本申请提供了一种并行环境的GPU程序优化方法,多个目标模型被配置于GPU集群中进行并行训练,该方法包括:对目标模型的并行训练配置进行策略配置与内存瓶颈预判;利用预判结果,通过并行策略组合与指令级性能监测进行吞吐量优化;对优化过程中出现的指令级瓶颈进行内核重优化,使得模型训练与GPU指令执行效率同步提升。
技术关键词
存储器访问效率 并行策略 程序优化方法 指令执行效率 性能预测模型 瓶颈 内核 内存 流水线指令 指令流水线 全局存储器 反馈控制系统 数据 集群 分析工具 动态 规模
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号