一种生成式大语言模型的预训练方法和装置

AITNT
正文
推荐专利
一种生成式大语言模型的预训练方法和装置
申请号:CN202411008948
申请日期:2024-07-26
公开号:CN118551750B
公开日期:2024-10-29
类型:发明专利
摘要
本发明实施例涉及一种生成式大语言模型的预训练方法和装置,所述方法包括:构建初始模型;构建初始数据集;对初始数据集预处理;初始化模型词汇表;对预处理数据集进行数据批次划分和排序;按反向预测方向根据模型词汇表和批次数据集序列对初始模型进行预训练得到反向模型;按正向预测方向根据模型词汇表、批次数据集序列和反向模型对初始模型进行预训练得到正向模型;评测正向模型;评测合格时将正向模型作为预训练结果输出。通过本发明可以降低生成式大语言模型的本地化发展难度、加快本地化发展应用进程。
技术关键词
文本 序列 大语言模型 元素 编码向量 评分方法 标记 符号 调度器 参数 解码器结构 标签 收发器 关系 大数据 计算机 输出模块 英语
系统为您推荐了相关专利信息
1
一种基于EN-DSD脑电通道选择的抑郁症自动检测方法
学习字典 自动检测方法 稀疏字典 通道 SVD算法
2
一种基于边缘智能的数据实时监测与预警方法
智能节点 预警方法 设备控制指令 设备控制接口 融合特征
3
一种基于概念漂移的边缘服务异常检测方法
服务异常检测方法 计数器 样本 滑动窗口 概念
4
监控业务方案生成方法、装置、电子设备、存储介质及计算机产品
生成方法 大语言模型 强化学习策略 链路 记忆
5
智能语音交互方法、装置、设备、存储介质和程序产品
智能语音交互方法 多模态特征 多头注意力机制 交互模型 智能语音交互装置
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号