推理计算方法及相关设备

AITNT
正文
推荐专利
推理计算方法及相关设备
申请号:CN202511070768
申请日期:2025-07-31
公开号:CN120930796A
公开日期:2025-11-11
类型:发明专利
摘要
本申请公开了一种推理计算方法及相关设备,涉及数据处理技术领域,包括:响应于推理计算指令,获取待推理的初始数据,基于预设推理引擎与预设推理优化策略,对所述初始数据进行推理计算,得到推理计算结果,其中,所述推理计算结果是基于推理计算过程中的注意力确定的,所述注意力是基于kv确定的,所述预设推理优化策略用于对所述kv进行压缩,以减少硬件资源消耗。本申请基于预设推理优化策略,对推理过程中的kv进行压缩,使推理引擎完成注意力计算只需要占用少量的资源,进而,在资源固定的情况下,可以进行更多的计算,加速推理速度。
技术关键词
计算方法 策略 注意力 内存 计算机程序产品 压缩算法 数据处理技术 处理器 样本 可读存储介质 存储器 元素 资源 指令 参数 速度
系统为您推荐了相关专利信息
1
一种动力电池单体电芯内部温度监测方法
薄膜热电偶传感器 电芯内部温度 动力电池单体 监测方法 电芯组件
2
一种基于流量预测的基站休眠方法
基站休眠方法 网络流量数据 预测网络流量 流量预测模型 动态
3
基于最终目标温度的大型中央空调多模型优化控制方法
大型中央空调 优化控制方法 热传导方程 多模型 空调系统控制技术
4
一种基于强化学习的多无人机协作边缘计算方法
协作边缘计算方法 边缘计算环境 无人机基站 遗传算法 无人机飞行轨迹
5
电力网络协议解析系统、方法、设备、介质和程序产品
网络协议解析系统 标识符 协处理器 现场可编程逻辑门阵列 芯片
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号