模型优化方法以及相关装置

AITNT
正文
推荐专利
模型优化方法以及相关装置
申请号:CN202411095571
申请日期:2024-08-12
公开号:CN118626415B
公开日期:2025-01-21
类型:发明专利
摘要
本发明实施例提供一种模型优化方法以及相关装置,属于人工智能技术领域。该方法包括:设置分层缓存区,分层缓存区用于在大模型运行过程中进行数据缓存;对大模型进行任务分解获得大模型对应的多个子任务;设置数据预取机制,根据数据预取机制将子任务运行过程中所需的初始运行数据存储至分层缓存区中;从分层缓存区中获得初始运行数据对子任务进行运行计算,获得子任务对应的中间运行数据;将全部中间运行数据进行合并,获得大模型对应的目标运行数据。该方法减少了重复数据的存储和运输并通过提前加载所需数据减少传输时间,能够有效解决大模型在显存占用、计算延迟和资源利用率方面的不足。
技术关键词
数据预取机制 模型优化方法 分层 前馈神经网络 数据访问模式 注意力机制 计算机存储介质 关系 层级 矩阵 终端设备 存储计算机程序 数据存储模块 人工智能技术 优化装置
系统为您推荐了相关专利信息
1
一种提高3D打印复合材料表面质量的熨烫处理方法
熨烫 构型 复合材料 预浸丝束 热固性树脂基体
2
一种基于多模态信息抽取的工程图纸图签识别方法及系统
图签识别方法 多模态信息 工程图纸 文本识别 信息抽取模型
3
一种面向机构调研PDF的多模态解析方法
模态解析方法 跨模态 表格 模板匹配算法 注意力机制
4
一种基于知识图谱的命名实体自动识别方法
自动识别方法 命名实体识别模型 文本信息传输 构建知识图谱 生成倒排索引
5
一种基于分层知识图谱的湿地语义虚拟地理环境构建方法
虚拟地理环境 实体 图谱 作业管理器 语义
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号