基于自注意力的无服务器应用场景的推理模型分区方法

正文

推荐专利

申请号：CN202510667886

申请日期：2025-05-23

公开号：CN120181246B

公开日期：2025-08-26

类型：发明专利

摘要

本发明公开了一种基于自注意力的无服务器应用场景的推理模型分区方法，该方法包括：步骤1：提取复合推理模型CIM的各子推理单元ISU中算子的性能数据，并对算子性能数据进行合并以及预处理；步骤2：构建基于XGBoost的资源预测模型；步骤3：对基于XGBoost的资源预测模型输出的数据进行层级合并与汇总，获得子推理单元的性能数据；步骤4：基于自注意力机制，对子推理单元的性能数据进行分析获得复合推理模型的层间依赖关系，生成分区策略；步骤5：依据分区策略，对复合推理模型进行分区，将每个分区对应的子模块封装为无服务器函数，完成独立部署分区。

技术关键词

分区策略内存数据注意力机制层级分区方法通信量混合结构 XGBoost模型瓶颈资源矩阵服务器模型超参数关系分支复杂度频率

系统为您推荐了相关专利信息

图像噪声模拟加噪方法、装置、设备及介质

噪声参数加噪方法图像矩阵面阵探测器

一种结合遥感和气象数据的冠层可燃物含水率预测方法

可燃物含水率参数生态数据同化技术气象预报数据

一种自动化测试用例的生成与执行方法及其系统

自动化测试用例生成测试用例测试用例编写代码覆盖率分析脚本

转向参数在线辨识方法、系统、设备及存储介质

参数在线辨识方法递归最小二乘法方向盘转向传动比前轮

代码转换方法、设备、存储介质及程序产品

代码转换方法优化训练数据关键词处理器存储计算机程序

基于自注意力的无服务器应用场景的推理模型分区方法

站点导航

APP 下载