异构平台的大模型部署方法、装置、设备及程序产品

AITNT
正文
推荐专利
异构平台的大模型部署方法、装置、设备及程序产品
申请号:CN202510032933
申请日期:2025-01-09
公开号:CN119415277B
公开日期:2025-05-09
类型:发明专利
摘要
本申请公开了一种异构平台的大模型部署方法、装置、设备及程序产品,涉及人工智能技术领域,本申请将待部署的大模型拆分为若干个子模型,根据每个子模型包含的算子类型及算子计算量,结合异构平台上各类型芯片的算子支持情况,确定每个子模型所要部署的目标芯片,并根据目标芯片的量化支持情况,确定每个子模型的量化策略,按照该量化策略对子模型进行量化,将量化后子模型及量化策略生成可部署的子模型,以便于部署到异构平台上对应的目标芯片中,实现大模型的自动化部署。本申请能够在大模型部署过程自动选择子模型所要部署的目标芯片,自动选择量化策略,相比于人工设置部署方案的方法,能够大幅提高部署效率,降低大模型端侧部署难度。
技术关键词
异构平台 模型部署方法 芯片 神经网络处理器 前馈神经网络 格式 图形处理器 均衡策略 人工智能技术 精度 计算机程序产品 模式匹配 列表 中央处理器 可读存储介质 存储器
系统为您推荐了相关专利信息
1
一种芯片后仿验证方法、装置、设备及存储介质
时序 验证方法 信号 芯片验证 参数
2
一种半导体芯片测试探针生产用打点机
半导体芯片 打点机 测试探针 螺纹杆 吸尘机构
3
基于物理信息约束与极限学习机的水利工程爆破块度预测方法、装置、介质及设备
极限学习机 爆破块度预测方法 粒子群优化算法 物理 炸药单耗
4
一种交换机及通信设备
柔性电路板 金手指 叠加结构 交换网板 球栅阵列
5
一种桌面工具管理装置
桌面工具 管理装置 识别芯片 充放电管理模块 检测模组
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号