大语言模型推理方法、装置、计算机设备及存储介质

AITNT
正文
推荐专利
大语言模型推理方法、装置、计算机设备及存储介质
申请号:CN202510990384
申请日期:2025-07-17
公开号:CN120875040A
公开日期:2025-10-31
类型:发明专利
摘要
本公开提供一种大语言模型推理方法、装置、计算机设备及存储介质,属于人工智能技术领域。本公开的大语言模型推理方法包括:根据令牌序列请求,查询本级缓存中存储的令牌序列;若本级缓存中存储的令牌序列被命中,则返回缓存结果;若本级缓存中存储的令牌序列未被命中,则查询下一级缓存;若各级缓存中存储的令牌序列均未被命中,则生成推理结果;将推理结果写入各级缓存,并返回推理结果。
技术关键词
令牌 推理方法 大语言模型 序列 推理装置 计算机设备 处理器 可读存储介质 人工智能技术 速率 存储器 控制模块 程序 频率 策略 缓冲 接口
系统为您推荐了相关专利信息
1
一种语音生成方法、装置、设备及其存储介质
文本特征向量 语音生成方法 声学特征 文本编码器 序列
2
针对零代码平台的可视化数据流编织方法、设备及介质
节点 编织方法 校验规则 数据流量统计 快照功能
3
基于物联网的核电智能隔离锁系统数据处理方法及装置
异常信息 标记 数据项 报告 锁系统
4
基于神经网络的刺绣版型自动制版方法
纹理 制版方法 刺绣图像 刺绣数据 坐标
5
一种智能手表的运动健康监测方法及系统
饱和度 智能手表 时间序列分析技术 陀螺仪数据 机器学习算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号