一种可拓展大模型训练推理方法、装置、设备及介质

正文

推荐专利

申请号：CN202411847995

申请日期：2024-12-16

公开号：CN119940525B

公开日期：2025-10-21

类型：发明专利

摘要

本发明公开了一种可拓展大模型训练推理方法、装置、设备及介质，其中方法包括：获取文本数据，构建训练集；构建大模型，所述大模型为堆叠式且在水平方向进行知识共享的模型结构，大模型包括多个子模型；构建一个自主动态判别器，每个子模型的输出都会输入自主动态判别器，自主动态判别器的输出作为最终的模型预测；采用训练集对大模型进行训练，将训练后的大模型用于实现文本生成任务。本发明以实现模型自主选择子模型为目标，通过自主动态判别器自主选择参与推理的子模型数量，进而提升大模型推理过程的效率，实现精度与速度的权衡，节省模型推理资源消耗。本发明可广泛应用于人工智能技术领域。

技术关键词

推理方法构建训练集动态文本编码器架构层级模型训练模块推理装置人工智能技术数据获取模块电子设备程序处理器参数可读存储介质存储器表达式阶段定义

系统为您推荐了相关专利信息

车辆的控制方法、车辆及存储介质

控制策略牵引力控制功能车辆动态控制防抱死制动功能电子稳定控制系统

一种肺结节特征分类方法、装置、设备及存储介质

检测肺结节计算机断层扫描机器学习模型特征分类方法深度学习模型

告警事件的处理方法、装置、设备、存储介质和程序产品

文本语义计算机程序产品分词模式

一种文本原型引导部位对齐的跨模态视频监控行人重识别方法

视频监控行人特征提取器重识别方法原型可见光图像

一种惯导系统姿态修正方法及计算机设备

姿态修正方法运动状态判别方法惯导系统误差修正模型加速度

一种可拓展大模型训练推理方法、装置、设备及介质

站点导航

APP 下载