摘要
本申请提供一种大模型预训练的方法、装置、设备、存储介质及程序产品,包括:获取文本数据,并对文本数据进行分句,得到句子数据集;针对句子数据集中的每个句子,根据预定义的掩码规则进行掩码,得到至少一个掩码对;句子数据集中所有句子根据预定义的掩码规则掩码后得到的多个掩码对构成检测数据集;其将检测数据集输入检测模型,得到预训练掩码对;基于预训练掩码对,预训练第一大模型。本方案通过将根据预定义的掩码规则进行掩码得到的掩码对进行检测,得到符合充分非必要关系的预训练掩码对;将该具有逻辑关系的预训练掩码对训练大模型,以提高大模型的逻辑推理能力。
技术关键词
掩码规则
模型预训练
计算机执行指令
数据
训练样本集
文本
实体
关系
处理器
可读存储介质
计算机程序产品
存储器
模块
电子设备
主题
系统为您推荐了相关专利信息
压力传感器阵列
数据采集系统
膝关节模型
曲面
三维扫描数据
测试结构
控制组件
航空发动机风扇
节流面积
三维仿真模型
智能测控系统
机器视觉测控系统
智能图像识别系统
测控方法
多通道
CAN隔离电路
电源变换模块
协处理器
板卡
隔离转换电路