摘要
本发明公开了一种数据划分方法和大模型推理方法、装置、设备及介质,应用于数据处理技术领域,包括:基于每个键值缓存对应的历史访问信息利用预测模型进行预测,得到每个键值缓存所关联的键值缓存的未来被访问的概率;基于每个键值缓存的访问频率参数、时间间隔和未来被访问的概率对键值缓存进行划分,确定热数据集合和冷数据集合,以将热数据集合中的键值缓存存储至速度最快的显存设备。本发明中的访问频率是从全局考虑,时间间隔是从时间局部角度考虑,未来被访问的概率从空间局部进行考虑,由于本发明从不同角度考虑对数据进行划分,故可以使得在推理时可以及时从准确的热数据集合中获取键值,从而提高大模型的推理速度。
技术关键词
键值
数据划分方法
历史访问信息
滑动时间窗口
推理方法
频率
注意力
参数
速度
关系
可读存储介质
存储计算机程序
大语言模型
数据处理技术
队列
模块
处理器
电子设备
系统为您推荐了相关专利信息
指数衰减函数
滑动时间窗口
深度神经网络技术
大型风力发电机组
风速
动态调度方法
指数
机器学习模型
表达式
智能调度技术
智慧控制系统
水质参数数据
深度学习预测
反射率
水体
数据处理方法
风险
意图识别模型
意图类别
可读存储介质