大模型预训练的方法、装置、设备、存储介质及程序产品

AITNT
正文
推荐专利
大模型预训练的方法、装置、设备、存储介质及程序产品
申请号:CN202510796982
申请日期:2025-06-13
公开号:CN120763655A
公开日期:2025-10-10
类型:发明专利
摘要
本申请提供一种大模型预训练的方法、装置、设备、存储介质及程序产品,包括:获取文本数据,并对文本数据进行分句,得到句子数据集;针对句子数据集中的每个句子,根据预定义的掩码规则进行掩码,得到至少一个掩码对;句子数据集中所有句子根据预定义的掩码规则掩码后得到的多个掩码对构成检测数据集;其将检测数据集输入检测模型,得到预训练掩码对;基于预训练掩码对,预训练第一大模型。本方案通过将根据预定义的掩码规则进行掩码得到的掩码对进行检测,得到符合充分非必要关系的预训练掩码对;将该具有逻辑关系的预训练掩码对训练大模型,以提高大模型的逻辑推理能力。
技术关键词
掩码规则 模型预训练 计算机执行指令 数据 训练样本集 文本 实体 关系 处理器 可读存储介质 计算机程序产品 存储器 模块 电子设备 主题
系统为您推荐了相关专利信息
1
基于平面膝关节压力试垫的数据采集系统和方法
压力传感器阵列 数据采集系统 膝关节模型 曲面 三维扫描数据
2
一种针对AM解调波形矫正算法
AD采样 矫正算法 电平 波形 数据
3
可调整内外涵流量的风扇试验件测试结构及其控制方法
测试结构 控制组件 航空发动机风扇 节流面积 三维仿真模型
4
一种压力检测多通道自动机器视觉测控方法及系统
智能测控系统 机器视觉测控系统 智能图像识别系统 测控方法 多通道
5
一种基于3UVPX的视频信号转换板卡
CAN隔离电路 电源变换模块 协处理器 板卡 隔离转换电路
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号