模型推理加速方法、系统、电子设备、存储介质及产品

AITNT
正文
推荐专利
模型推理加速方法、系统、电子设备、存储介质及产品
申请号:CN202510724702
申请日期:2025-05-30
公开号:CN120258152B
公开日期:2025-08-12
类型:发明专利
摘要
本申请公开了一种模型推理加速方法、系统、电子设备、存储介质及产品,涉及人工智能技术领域,包括获取第一计算模块中序列化模型的中间变量,中间变量包括键值副本、中间层潜在特征和深层输出特征中至少一项,中间层潜在特征为第一计算模块和第二计算模块中相似度不低于预设相似阈值的特征,中间层潜在特征是由第一计算模块中浅层计算块确定的,深层输出特征是由第一计算模块中深层计算块确定的;确定相似度不低于预设相似阈值的特征为第二计算模块中深层计算块的输入,以使第二计算模块得到序列化模型的预测结果,解决了相关方案中缓存快速膨胀,导致模型推理速度慢的技术问题,达到了减少冗余计算,进而加快模型推理的速度的技术效果。
技术关键词
输出特征 中间层 加速系统 键值 副本 注意力 变量 决策控制模块 电子设备 可读存储介质 存储计算机程序 人工智能技术 计算机程序产品 矩阵 模块通信 处理器 参数 冗余
系统为您推荐了相关专利信息
1
神经网络模型的编译方法、数据加载方法、设备及介质
神经网络模型 数据加载方法 编译方法 数据加载装置 计算机程序产品
2
智能通勤处理方法及装置、介质、设备
中间层 指标 优化地图数据 策略 时效性
3
一种目标识别方法、系统、电子设备和存储介质
注意力机制 融合图像特征 分块 输出特征 卷积特征
4
基于深度聚类的虚拟电厂柔性资源聚合方法及电子设备
柔性 资源 动态时间规整 重构 信息熵
5
一种基于增强型生成网络的中国传统书画融合方法及装置
融合方法 生成器网络 汉字 生成融合图像 输出特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号