摘要
本发明公开了一种可拓展大模型训练推理方法、装置、设备及介质,其中方法包括:获取文本数据,构建训练集;构建大模型,所述大模型为堆叠式且在水平方向进行知识共享的模型结构,大模型包括多个子模型;构建一个自主动态判别器,每个子模型的输出都会输入自主动态判别器,自主动态判别器的输出作为最终的模型预测;采用训练集对大模型进行训练,将训练后的大模型用于实现文本生成任务。本发明以实现模型自主选择子模型为目标,通过自主动态判别器自主选择参与推理的子模型数量,进而提升大模型推理过程的效率,实现精度与速度的权衡,节省模型推理资源消耗。本发明可广泛应用于人工智能技术领域。
技术关键词
推理方法
构建训练集
动态
文本
编码器架构
层级
模型训练模块
推理装置
人工智能技术
数据获取模块
电子设备
程序
处理器
参数
可读存储介质
存储器
表达式
阶段
定义
系统为您推荐了相关专利信息
控制策略
牵引力控制功能
车辆动态控制
防抱死制动功能
电子稳定控制系统
检测肺结节
计算机断层扫描
机器学习模型
特征分类方法
深度学习模型
视频监控行人
特征提取器
重识别方法
原型
可见光图像
姿态修正方法
运动状态判别方法
惯导系统
误差修正模型
加速度