大模型的优化方法、装置和电子设备

正文

推荐专利

大模型的优化方法、装置和电子设备

申请号：CN202411035152

申请日期：2024-07-30

公开号：CN118966281A

公开日期：2024-11-15

类型：发明专利

摘要

本公开提出了一种大模型的优化方法、装置和电子设备，涉及人工智能技术领域，具体为大模型和深度学习等技术领域，包括：从多头自注意力MHA结构的第一大模型中抽取模型参数，得到模型参数集合，对第一类模型参数进行奇异值分解SVD，得到第一类模型参数的近似矩阵对；基于第一类模型参数的近似矩阵对和第二类模型参数，生成多头隐式自注意力MLA结构的第二大模型，本公开通过对第一类模型参数进行奇异值分解，得到第一类模型参数的近似矩阵对，并基于第一类模型参数的近似矩阵对和第二类模型参数，生成MLA结构的第二大模型，提高了生成大模型的效率以及大模型的性能，降低了生成大模型的成本。

技术关键词

矩阵参数注意力可执行程序代码平方根模块电子设备人工智能技术计算机程序产品处理器优化装置元素可读存储介质存储器网络

系统为您推荐了相关专利信息

一种截断正态先验下复材结构非概率可信可靠性分析方法

可靠性分析方法概率密度函数不确定性参数飞行器复合材料不确定性传播分析

低压台区分布式光伏消纳能力在线评估方法

线性规划模型在线评估方法分布式光伏光伏消纳能力智能电表采集

基于认知机制的人因可靠性分析方法及装置

可靠性分析方法人因可靠性分析可靠性分析模型累积分布函数操作规程

一种基于KAAE的旋转机械无监督异常检测方法

旋转机械滑动窗口采样样本解码网络异常状态

一种车联网硬件在环测试方法及装置

场景射线参数测试方法模拟真实世界

大模型的优化方法、装置和电子设备

站点导航

APP 下载