摘要
本申请公开了一种人工智能服务系统的建立方法、设备、装置和存储介质,其中方法包括步骤:获取人工智能的预训练模型以及预设的初始令牌裁剪比例集;根据初始令牌裁剪比例集,对预训练模型进行多轮的微调和推理,得到每轮推理对应的第一令牌裁剪比例;其中,对于任意的一个推理轮次,第一令牌裁剪比例通过第二令牌裁剪比例和第三令牌裁剪比例得到;第二令牌裁剪比例和第三令牌裁剪比例为初始令牌裁剪比例集的所有初始裁剪比例和上一轮中得到的第一令牌裁剪比例中推理准确度差值最大的两个令牌裁剪比例;根据各个第一令牌裁剪比例,得到每个第一令牌裁剪比例对应的第一模型并建立人工智能服务系统。本申请可广泛应用于人工智能技术领域。
技术关键词
人工智能服务系统
令牌
预训练模型
系统资源消耗
资源约束条件
处理单元
处理器
人工智能技术
参数
可读存储介质
程序
指令
存储器
计算机
系统为您推荐了相关专利信息
表格
生成结构化信息
预训练模型
电子商务订单
企业财务报表
视觉问答方法
多模态特征
令牌
表格特征
大语言模型
混合特征提取
车辆状态数据
局部特征提取
混合器模块
图像