一种基于前后请求感知的长序列自适应切分方法

AITNT
正文
推荐专利
一种基于前后请求感知的长序列自适应切分方法
申请号:CN202511080273
申请日期:2025-08-04
公开号:CN120973494A
公开日期:2025-11-18
类型:发明专利
摘要
一种基于前后请求感知的长序列自适应切分方法,包括步骤:步骤3、构建流水线气泡时间模型;流水线气泡时间包括初始等待时间和子块计算时间差异;步骤4、构建切分损失预测模型,包括:步骤4.1、通过注意力计算损失量化实际分块个数小于最佳分块个数的损失;步骤4.2、通过细粒度切分损失量化实际分块个数超过最佳分块个数的损失;步骤5、采集切分损失数据;根据切分损失数据对切分损失预测模型的因变量与待拟合参数进行拟合;步骤6、将解码层计算时间、流水线气泡时间、切分损失时间求和得到总执行时间;步骤7、遍历所有分块个数,循环执行步骤6,获取对应的切分策略及总执行时间;选择总执行时间最短的切分策略作为最佳策略。
技术关键词
时间预测模型 流水线 分块 序列 解码 气泡 注意力 策略 参数 阶段 数据 复杂度 损耗 线性 场景 框架
系统为您推荐了相关专利信息
1
基于函数依赖分析的交易顺序依赖漏洞检测系统和方法
漏洞检测系统 序列 变异策略 分析模块 虚拟执行环境
2
优化烟丝生产中不同分组批次时间分配的智能调度方法
智能调度方法 烟丝生产线 优化预测模型 训练预测模型 优化资源利用率
3
一种光流估计和场景流估计的方法、设备及介质
特征金字塔 跨模态 蒸馏 点云模型 点云特征
4
索引构建方法及装置
索引构建方法 分片 距离信息 计算机可执行指令 数据存储
5
一种基于Transformer多尺度融合网络的脑肿瘤图像分割方法
图像分割方法 组合模块 多尺度融合网络 瓶颈 多尺度网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号