一种大语言模型推理方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
一种大语言模型推理方法、装置、电子设备及存储介质
申请号:CN202510549064
申请日期:2025-04-28
公开号:CN120633822A
公开日期:2025-09-12
类型:发明专利
摘要
本发明提供一种大语言模型推理方法、装置、电子设备及存储介质,其中方法包括:在接收到当前请求的情况下,根据映射表查找存储空间中与已存储的各个请求对应的历史高存储效率张量,将历史高存储效率张量转换为历史目标张量;根据当前请求通过大语言模型执行当前轮推理,获取当前轮推理过程中大语言模型各层对应的中间张量,在中间张量中获取大语言模型的注意力层计算需要的当前目标张量;查找作为当前目标张量前驱的当前高存储效率张量,将当前请求以及对应的当前高存储效率张量作为历史中间数据保存至存储空间,并更新映射表;将历史目标张量和当前目标张量输入至注意力层进行计算,得到当前请求对应的推理文本,有效减少了冗余计算。
技术关键词
大语言模型 推理方法 注意力 推理系统 硬件加速器 文本 非暂态计算机可读存储介质 访问存储空间 字符 数据 电子设备 推理装置 处理器 计算机程序产品 队列 转换单元 关系 存储器 曲线 拷贝
系统为您推荐了相关专利信息
1
生产线管理方法、电子设备
实时图像 管理方法 机器人 注意力参数 数据
2
对小说进行信息提取和汇总的方法、电子设备和存储介质
大语言模型 文本 知识图谱数据库 构建知识图谱 电子设备
3
一种基于大语言模型的养老智能服务终端
智能服务终端 大语言模型 屏幕显示模块 鼾声检测 姿势识别
4
大语言模型确定方法、装置及程序产品
大语言模型 高斯分布模型 数据 计算机程序产品 阶段
5
表格问答方法、装置、电子设备及存储介质
问答方法 表格 键值 字典 代码解释器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号