一种大语言模型的推理方法以及装置

AITNT
正文
推荐专利
一种大语言模型的推理方法以及装置
申请号:CN202410773361
申请日期:2024-06-14
公开号:CN121009974A
公开日期:2025-11-25
类型:发明专利
摘要
本申请实施例公开了一种大语言模型的推理方法以及装置,用于提升大语言模型的推理计算效率。本申请实施例方法包括:接收推理任务,推理任务携带语素编号,语素编号用于标识待进行推理计算的语素,语素包括基于大语言模型的输入文本确定的一个或多个子词。基于推理任务对应的语素编号查询全局索引树,确定目标推理节点,全局索引树包括分布式推理集群中多个推理节点对应的子树,目标推理节点对应的子树为全局索引树中与语素编号的相似匹配度大于阈值的子树,相似匹配度指示推理计算中可复用的键值缓存数据数量。基于目标推理节点执行推理任务。
技术关键词
大语言模型 键值 节点 神经网络处理单元 索引 文本 推理方法 集群 图形处理单元 数据处理单元 计算机程序产品 处理器 指令 推理装置 词语 分词 关系
系统为您推荐了相关专利信息
1
一种机组组合优化问题的训练数据增强和快速生成方法
快速生成方法 新能源场站 电力系统机组组合 机组组合模型 样本
2
基于脉冲神经网络的图像分析方法及相关装置
脉冲 图像分析方法 模块 节点 局部特征提取
3
一种基于嵌入式注意力策略和多层次编码网络的无人机控制方法
无人机控制方法 多层次 网络 编码 邻居
4
一种基于临床辅助决策的手术麻醉信息预警方法及系统
神经肌肉功能 临床辅助决策 患者 面部 信息预警方法
5
一种多重降维下应用红嘴蓝鹊算法的电网故障诊断方法
电网故障诊断方法 信息编码 节点 算法 断路器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号