模型优化方法以及相关装置

正文

推荐专利

模型优化方法以及相关装置

申请号：CN202411095571

申请日期：2024-08-12

公开号：CN118626415B

公开日期：2025-01-21

类型：发明专利

摘要

本发明实施例提供一种模型优化方法以及相关装置，属于人工智能技术领域。该方法包括：设置分层缓存区，分层缓存区用于在大模型运行过程中进行数据缓存；对大模型进行任务分解获得大模型对应的多个子任务；设置数据预取机制，根据数据预取机制将子任务运行过程中所需的初始运行数据存储至分层缓存区中；从分层缓存区中获得初始运行数据对子任务进行运行计算，获得子任务对应的中间运行数据；将全部中间运行数据进行合并，获得大模型对应的目标运行数据。该方法减少了重复数据的存储和运输并通过提前加载所需数据减少传输时间，能够有效解决大模型在显存占用、计算延迟和资源利用率方面的不足。

技术关键词

数据预取机制模型优化方法分层前馈神经网络数据访问模式注意力机制计算机存储介质关系层级矩阵终端设备存储计算机程序数据存储模块人工智能技术优化装置

系统为您推荐了相关专利信息

一种提高3D打印复合材料表面质量的熨烫处理方法

熨烫构型复合材料预浸丝束热固性树脂基体

一种基于多模态信息抽取的工程图纸图签识别方法及系统

图签识别方法多模态信息工程图纸文本识别信息抽取模型

一种面向机构调研PDF的多模态解析方法

模态解析方法跨模态表格模板匹配算法注意力机制

一种基于知识图谱的命名实体自动识别方法

自动识别方法命名实体识别模型文本信息传输构建知识图谱生成倒排索引

一种基于分层知识图谱的湿地语义虚拟地理环境构建方法

虚拟地理环境实体图谱作业管理器语义

模型优化方法以及相关装置

站点导航

APP 下载