摘要
本发明实施例涉及一种生成式大语言模型的预训练方法和装置,所述方法包括:构建初始模型;构建初始数据集;对初始数据集预处理;初始化模型词汇表;对预处理数据集进行数据批次划分和排序;按反向预测方向根据模型词汇表和批次数据集序列对初始模型进行预训练得到反向模型;按正向预测方向根据模型词汇表、批次数据集序列和反向模型对初始模型进行预训练得到正向模型;评测正向模型;评测合格时将正向模型作为预训练结果输出。通过本发明可以降低生成式大语言模型的本地化发展难度、加快本地化发展应用进程。
技术关键词
文本
序列
大语言模型
元素
编码向量
评分方法
标记
符号
调度器
参数
解码器结构
标签
收发器
关系
大数据
计算机
输出模块
英语
系统为您推荐了相关专利信息
学习字典
自动检测方法
稀疏字典
通道
SVD算法
智能节点
预警方法
设备控制指令
设备控制接口
融合特征
智能语音交互方法
多模态特征
多头注意力机制
交互模型
智能语音交互装置