大模型的优化方法、装置和电子设备

AITNT
正文
推荐专利
大模型的优化方法、装置和电子设备
申请号:CN202411035152
申请日期:2024-07-30
公开号:CN118966281A
公开日期:2024-11-15
类型:发明专利
摘要
本公开提出了一种大模型的优化方法、装置和电子设备,涉及人工智能技术领域,具体为大模型和深度学习等技术领域,包括:从多头自注意力MHA结构的第一大模型中抽取模型参数,得到模型参数集合,对第一类模型参数进行奇异值分解SVD,得到第一类模型参数的近似矩阵对;基于第一类模型参数的近似矩阵对和第二类模型参数,生成多头隐式自注意力MLA结构的第二大模型,本公开通过对第一类模型参数进行奇异值分解,得到第一类模型参数的近似矩阵对,并基于第一类模型参数的近似矩阵对和第二类模型参数,生成MLA结构的第二大模型,提高了生成大模型的效率以及大模型的性能,降低了生成大模型的成本。
技术关键词
矩阵 参数 注意力 可执行程序代码 平方根 模块 电子设备 人工智能技术 计算机程序产品 处理器 优化装置 元素 可读存储介质 存储器 网络
系统为您推荐了相关专利信息
1
一种截断正态先验下复材结构非概率可信可靠性分析方法
可靠性分析方法 概率密度函数 不确定性参数 飞行器复合材料 不确定性传播分析
2
低压台区分布式光伏消纳能力在线评估方法
线性规划模型 在线评估方法 分布式光伏 光伏消纳能力 智能电表采集
3
基于认知机制的人因可靠性分析方法及装置
可靠性分析方法 人因可靠性分析 可靠性分析模型 累积分布函数 操作规程
4
一种基于KAAE的旋转机械无监督异常检测方法
旋转机械 滑动窗口采样 样本 解码网络 异常状态
5
一种车联网硬件在环测试方法及装置
场景 射线 参数 测试方法 模拟真实世界
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号