摘要
本发明公开了一种基于自注意力的无服务器应用场景的推理模型分区方法,该方法包括:步骤1:提取复合推理模型CIM的各子推理单元ISU中算子的性能数据,并对算子性能数据进行合并以及预处理;步骤2:构建基于XGBoost的资源预测模型;步骤3:对基于XGBoost的资源预测模型输出的数据进行层级合并与汇总,获得子推理单元的性能数据;步骤4:基于自注意力机制,对子推理单元的性能数据进行分析获得复合推理模型的层间依赖关系,生成分区策略;步骤5:依据分区策略,对复合推理模型进行分区,将每个分区对应的子模块封装为无服务器函数,完成独立部署分区。
技术关键词
分区策略
内存
数据
注意力机制
层级
分区方法
通信量
混合结构
XGBoost模型
瓶颈
资源
矩阵
服务器
模型超参数
关系
分支
复杂度
频率
系统为您推荐了相关专利信息
可燃物含水率
参数
生态
数据同化技术
气象预报数据
自动化测试用例
生成测试用例
测试用例编写
代码覆盖率分析
脚本
参数在线辨识方法
递归最小二乘法
方向盘
转向传动比
前轮
代码转换方法
优化训练数据
关键词
处理器
存储计算机程序