基于自注意力的无服务器应用场景的推理模型分区方法

AITNT
正文
推荐专利
基于自注意力的无服务器应用场景的推理模型分区方法
申请号:CN202510667886
申请日期:2025-05-23
公开号:CN120181246B
公开日期:2025-08-26
类型:发明专利
摘要
本发明公开了一种基于自注意力的无服务器应用场景的推理模型分区方法,该方法包括:步骤1:提取复合推理模型CIM的各子推理单元ISU中算子的性能数据,并对算子性能数据进行合并以及预处理;步骤2:构建基于XGBoost的资源预测模型;步骤3:对基于XGBoost的资源预测模型输出的数据进行层级合并与汇总,获得子推理单元的性能数据;步骤4:基于自注意力机制,对子推理单元的性能数据进行分析获得复合推理模型的层间依赖关系,生成分区策略;步骤5:依据分区策略,对复合推理模型进行分区,将每个分区对应的子模块封装为无服务器函数,完成独立部署分区。
技术关键词
分区策略 内存 数据 注意力机制 层级 分区方法 通信量 混合结构 XGBoost模型 瓶颈 资源 矩阵 服务器 模型超参数 关系 分支 复杂度 频率
系统为您推荐了相关专利信息
1
图像噪声模拟加噪方法、装置、设备及介质
噪声参数 加噪方法 图像 矩阵 面阵探测器
2
一种结合遥感和气象数据的冠层可燃物含水率预测方法
可燃物含水率 参数 生态 数据同化技术 气象预报数据
3
一种自动化测试用例的生成与执行方法及其系统
自动化测试用例 生成测试用例 测试用例编写 代码覆盖率分析 脚本
4
转向参数在线辨识方法、系统、设备及存储介质
参数在线辨识方法 递归最小二乘法 方向盘 转向传动比 前轮
5
代码转换方法、设备、存储介质及程序产品
代码转换方法 优化训练数据 关键词 处理器 存储计算机程序
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号