语言模型训练方法、设备、存储介质以及产品

正文

推荐专利

申请号：CN202510284828

申请日期：2025-03-11

公开号：CN120218178A

公开日期：2025-06-27

类型：发明专利

摘要

本申请公开了一种语言模型训练方法、设备、存储介质以及产品，涉及自然语言处理技术领域，方法包括：获取公开文本数据，将所述公开文本数据输入到所述文本组成单元选择模型，确定出所述公开文本数据中多个文本组成单元位置各自对应的第一文本组成单元；将各所述第一文本组成单元，发送至各所述第二设备，以供所述第二设备根据各所述第一文本组成单元进行词表映射，得到各自对应的第二文本组成单元；联合各所述第二设备根据各所述第一文本组成单元和各所述第二文本组成单元，优化所述大语言模型和所述小语言模型，获得训练完成的大语言模型。通过选择文本组成单元来优化模型自然语言处理能力的训练过程，以提高大语言模型的模型处理能力。

技术关键词

大语言模型语言模型训练方法数据计算机程序产品模型训练设备自然语言截断方法标签文本对齐方法处理器设备通信教师学生可读存储介质存储器异构

系统为您推荐了相关专利信息

一种超声波水表流量曲线拟合系统

超声波水表噪声数据采集神经网络模型数据采集模块可视化模块

一种视频内容识别自动分类的方法及系统

模态特征多模态信息融合深度学习融合音频特征学习分类器

一种电网统一模型设计方法以及系统

模型设计方法模型设计系统结构设计模块字符串编码方法配网故障指示器

实现红外接收检测与按键检测引脚复用的电路及方法

按键 MOS管电阻电路红外接收头

一种可视化智能交互设计系统

交互设计系统结构设计模块构建三维场景三维模型色域覆盖率

语言模型训练方法、设备、存储介质以及产品

站点导航

APP 下载