一种生成式大语言模型的预训练方法和装置

正文

推荐专利

一种生成式大语言模型的预训练方法和装置

申请号：CN202411008948

申请日期：2024-07-26

公开号：CN118551750B

公开日期：2024-10-29

类型：发明专利

摘要

本发明实施例涉及一种生成式大语言模型的预训练方法和装置，所述方法包括：构建初始模型；构建初始数据集；对初始数据集预处理；初始化模型词汇表；对预处理数据集进行数据批次划分和排序；按反向预测方向根据模型词汇表和批次数据集序列对初始模型进行预训练得到反向模型；按正向预测方向根据模型词汇表、批次数据集序列和反向模型对初始模型进行预训练得到正向模型；评测正向模型；评测合格时将正向模型作为预训练结果输出。通过本发明可以降低生成式大语言模型的本地化发展难度、加快本地化发展应用进程。

技术关键词

文本序列大语言模型元素编码向量评分方法标记符号调度器参数解码器结构标签收发器关系大数据计算机输出模块英语

系统为您推荐了相关专利信息

一种基于EN-DSD脑电通道选择的抑郁症自动检测方法

学习字典自动检测方法稀疏字典通道 SVD算法

一种基于边缘智能的数据实时监测与预警方法

智能节点预警方法设备控制指令设备控制接口融合特征

一种基于概念漂移的边缘服务异常检测方法

服务异常检测方法计数器样本滑动窗口概念

监控业务方案生成方法、装置、电子设备、存储介质及计算机产品

生成方法大语言模型强化学习策略链路记忆

智能语音交互方法、装置、设备、存储介质和程序产品

智能语音交互方法多模态特征多头注意力机制交互模型智能语音交互装置

一种生成式大语言模型的预训练方法和装置

站点导航

APP 下载