模型推理方法、电子设备及存储介质

AITNT
正文
推荐专利
模型推理方法、电子设备及存储介质
申请号:CN202510953795
申请日期:2025-07-10
公开号:CN120450057B
公开日期:2025-09-02
类型:发明专利
摘要
本申请公开了一种模型推理方法、电子设备及存储介质,涉及计算机技术领域,方法包括:获取待处理数据;对待处理数据进行预填充处理,将预填充处理生成的键值缓存保存至第一缓冲区,并向第二缓冲区传输该键值缓存;第一缓冲区属于预填充节点对应的连接器,第二缓冲区属于解码节点对应的连接器;从第二缓冲区加载键值缓存,并进行解码处理;在解码处理的过程中,监控解码节点内的图形处理器的内存利用率,根据内存利用率,调整键值缓存的存放位置;其中,解码节点设置有计算快速链接内存,上述存放位置包括该计算快速链接内存与图形处理器的内存;输出解码处理结果。通过本申请提供的方案,可以有效保障解码效率,进而保障模型推理过程有效运行。
技术关键词
图形处理器 键值 内存 推理方法 解码 通信带宽 节点 电子设备 可读存储介质 存储计算机程序 路由器 计算机程序产品 中央处理器 数据 存储器
系统为您推荐了相关专利信息
1
考虑用户隐私的分布式住宅负荷预测模型热启动方法及系统
负荷预测模型 热启动方法 住宅 解码网络 预测网络模型
2
一种基于大模型与检索对比的小语种图片描述生成方法
文本 大语言模型 平行语料数据 图片 生成方法
3
漏洞攻击样本表征方法、装置、存储介质及电子设备
漏洞 样本 条目 表征方法 上下文无关文法
4
模型训练推理方法、装置、设备、介质及程序产品
推理方法 推理系统 计算机执行指令 大型服务器集群 推理装置
5
一种CPCI-E显示控制模块
显示控制模块 集成器件 PCH芯片 内存 信号
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号