摘要
本申请公开了一种语言模型训练方法、设备、存储介质以及产品,涉及自然语言处理技术领域,方法包括:获取公开文本数据,将所述公开文本数据输入到所述文本组成单元选择模型,确定出所述公开文本数据中多个文本组成单元位置各自对应的第一文本组成单元;将各所述第一文本组成单元,发送至各所述第二设备,以供所述第二设备根据各所述第一文本组成单元进行词表映射,得到各自对应的第二文本组成单元;联合各所述第二设备根据各所述第一文本组成单元和各所述第二文本组成单元,优化所述大语言模型和所述小语言模型,获得训练完成的大语言模型。通过选择文本组成单元来优化模型自然语言处理能力的训练过程,以提高大语言模型的模型处理能力。
技术关键词
大语言模型
语言模型训练方法
数据
计算机程序产品
模型训练设备
自然语言
截断方法
标签文本
对齐方法
处理器
设备通信
教师
学生
可读存储介质
存储器
异构
系统为您推荐了相关专利信息
超声波水表
噪声数据采集
神经网络模型
数据采集模块
可视化模块
模态特征
多模态信息融合
深度学习融合
音频特征
学习分类器
模型设计方法
模型设计系统
结构设计模块
字符串编码方法
配网故障指示器
交互设计系统
结构设计模块
构建三维场景
三维模型
色域覆盖率