一种数据划分方法和大模型推理方法、装置、设备及介质

AITNT
正文
推荐专利
一种数据划分方法和大模型推理方法、装置、设备及介质
申请号:CN202511071642
申请日期:2025-07-31
公开号:CN120909791A
公开日期:2025-11-07
类型:发明专利
摘要
本发明公开了一种数据划分方法和大模型推理方法、装置、设备及介质,应用于数据处理技术领域,包括:基于每个键值缓存对应的历史访问信息利用预测模型进行预测,得到每个键值缓存所关联的键值缓存的未来被访问的概率;基于每个键值缓存的访问频率参数、时间间隔和未来被访问的概率对键值缓存进行划分,确定热数据集合和冷数据集合,以将热数据集合中的键值缓存存储至速度最快的显存设备。本发明中的访问频率是从全局考虑,时间间隔是从时间局部角度考虑,未来被访问的概率从空间局部进行考虑,由于本发明从不同角度考虑对数据进行划分,故可以使得在推理时可以及时从准确的热数据集合中获取键值,从而提高大模型的推理速度。
技术关键词
键值 数据划分方法 历史访问信息 滑动时间窗口 推理方法 频率 注意力 参数 速度 关系 可读存储介质 存储计算机程序 大语言模型 数据处理技术 队列 模块 处理器 电子设备
系统为您推荐了相关专利信息
1
基于图像和文本的推理方法、装置、设备及介质
文本 数据 坐标 推理方法 推理平台
2
一种风力发电机组多维动态安全域构建方法
指数衰减函数 滑动时间窗口 深度神经网络技术 大型风力发电机组 风速
3
一种智能制造系统动态调度方法
动态调度方法 指数 机器学习模型 表达式 智能调度技术
4
一种除氟用多维智慧控制系统
智慧控制系统 水质参数数据 深度学习预测 反射率 水体
5
数据处理方法和装置、存储介质及电子设备
数据处理方法 风险 意图识别模型 意图类别 可读存储介质
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号