大语言模型推理方法、装置、电子设备、存储介质及程序产品

AITNT
正文
推荐专利
大语言模型推理方法、装置、电子设备、存储介质及程序产品
申请号:CN202510994682
申请日期:2025-07-18
公开号:CN120952152A
公开日期:2025-11-14
类型:发明专利
摘要
本申请提供一种大语言模型推理方法、装置、电子设备、存储介质及程序产品。该方法包括:针对至少一个transformer模块中的每个注意力头,根据当前token计算注意力头对应的重要性指标;根据重要性指标从多个注意力头中筛选目标注意力头;基于目标注意力头对当前token进行推理,获得transformer模块的中间推理结果;基于中间推理结果进行后续推理,获得大模型输出的最终推理结果。本申请在利用大语言模型中的注意力机制模块对当前token进行推理之前,计算每个注意力头对于当前token的重要性指标,基于重要性指标筛选用于后续推理的目标注意力头,实现对不重要的注意力头的剪枝,降低了在注意力机制模块推理过程中的计算量,从而提高了推理效率。
技术关键词
前馈神经网络 大语言模型 模块 推理方法 指标 计算机程序指令 偏差 绝对值算法 多头注意力机制 电子设备 推理装置 处理器 近似算法 级联 计算机程序产品 存储器
系统为您推荐了相关专利信息
1
基于动态多模态知识图谱的跨学科科研潜力评估方法
潜力评估方法 科研 热点 节点 主题
2
一种面向城市建成区廊道空间形态识别的方法及系统
形态 建成区 分区模型 模糊逻辑 网格
3
网格模型的处理方法、装置、存储介质及电子设备
顶点 网格模型 几何体模型 生成网络模型 可读存储介质
4
一种基于神经网络的换流阀关键元器件灼烧缺陷识别方法
缺陷识别方法 换流阀 融合神经网络 元器件 滑动窗口技术
5
一种电解槽槽芯堆叠一致性检测装置及其下线、在线检测方法
激光测距模块 PLC控制器 电解槽 一致性检测 直线导轨
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号