一种推理装置、方法、介质及芯片

AITNT
正文
推荐专利
一种推理装置、方法、介质及芯片
申请号:CN202411823795
申请日期:2024-12-12
公开号:CN119294533A
公开日期:2025-01-10
类型:发明专利
摘要
本申请公开一种推理装置、方法、介质及芯片,该装置用于大语言模型的推理运算,包括:内存模块、计算模块和控制模块;控制模块接收到处理指令,获取目标数量的序列存入内存模块,在任一序列处理完毕后,释放已处理完毕的序列及对应的推理结果所占用的存储空间和计算资源,从剩余序列中选取另一序列,存入已推理完毕的序列所释放的存储空间。本申请在对待处理文本进行推理时,当任一序列完成推理后,即可释放该序列对应的存储空间和计算资源,并存入新的序列进行推理,从而大幅提高的内存模块和计算模块的利用率,提高了大语言模型的推理效率。
技术关键词
推理装置 内存模块 推理方法 序列 代表 控制模块 文本 大语言模型 数据 指令 芯片 可读存储介质
系统为您推荐了相关专利信息
1
一种基于有限元的单工况内力计算方法及系统
频率响应特征 数据 内力计算方法 作用力 矩阵
2
音乐推荐模型处理方法、音乐推荐方法、设备和存储介质
音乐推荐模型 样本 权重特征 音乐推荐方法 序列
3
一种基于指标数据修复模型的根因定位方法及装置
指标 微服务实例 门控循环单元网络 定位方法 离线
4
一种航空航天智能制造大模型构建方法
模型构建方法 专业知识库 面向航空航天 增量更新 计算机视觉分析技术
5
一种基于双向时间卷积与Transformer的轴承故障分类方法
轴承故障分类方法 多头注意力机制 故障分类模型 麦克风阵列 卷积模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号