一种可拓展大模型训练推理方法、装置、设备及介质

AITNT
正文
推荐专利
一种可拓展大模型训练推理方法、装置、设备及介质
申请号:CN202411847995
申请日期:2024-12-16
公开号:CN119940525B
公开日期:2025-10-21
类型:发明专利
摘要
本发明公开了一种可拓展大模型训练推理方法、装置、设备及介质,其中方法包括:获取文本数据,构建训练集;构建大模型,所述大模型为堆叠式且在水平方向进行知识共享的模型结构,大模型包括多个子模型;构建一个自主动态判别器,每个子模型的输出都会输入自主动态判别器,自主动态判别器的输出作为最终的模型预测;采用训练集对大模型进行训练,将训练后的大模型用于实现文本生成任务。本发明以实现模型自主选择子模型为目标,通过自主动态判别器自主选择参与推理的子模型数量,进而提升大模型推理过程的效率,实现精度与速度的权衡,节省模型推理资源消耗。本发明可广泛应用于人工智能技术领域。
技术关键词
推理方法 构建训练集 动态 文本 编码器架构 层级 模型训练模块 推理装置 人工智能技术 数据获取模块 电子设备 程序 处理器 参数 可读存储介质 存储器 表达式 阶段 定义
系统为您推荐了相关专利信息
1
车辆的控制方法、车辆及存储介质
控制策略 牵引力控制功能 车辆动态控制 防抱死制动功能 电子稳定控制系统
2
一种肺结节特征分类方法、装置、设备及存储介质
检测肺结节 计算机断层扫描 机器学习模型 特征分类方法 深度学习模型
3
告警事件的处理方法、装置、设备、存储介质和程序产品
文本 语义 计算机程序产品 分词 模式
4
一种文本原型引导部位对齐的跨模态视频监控行人重识别方法
视频监控行人 特征提取器 重识别方法 原型 可见光图像
5
一种惯导系统姿态修正方法及计算机设备
姿态修正方法 运动状态判别方法 惯导系统 误差修正模型 加速度
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号