一种基于混合专家和参数重用的模型构建方法
站点导航
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
AI需求对接
APP 下载
iOS 下载
安卓下载
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
清空
确定
AITNT
正文
推荐专利
一种基于混合专家和参数重用的模型构建方法
申请号:
CN202410863999
申请日期:
2024-06-30
公开号:
CN118690783A
公开日期:
2024-09-24
类型:
发明专利
摘要
本发明公开了一种基于混合专家和参数重用的模型构建方法,包括MoE模块构建、推理时专家合并、立即块重用三个部分。本发明能够实现更好的精度、体积、速度权衡的transformer架构模型。
技术关键词
模型构建方法
合并方法
代表
网络深度
模块
线性
超参数
注意力
动态
分支
数据
精度
速度
沪ICP备2023015588号