语言模型训练方法、设备、存储介质以及产品

AITNT
正文
推荐专利
语言模型训练方法、设备、存储介质以及产品
申请号:CN202510284828
申请日期:2025-03-11
公开号:CN120218178A
公开日期:2025-06-27
类型:发明专利
摘要
本申请公开了一种语言模型训练方法、设备、存储介质以及产品,涉及自然语言处理技术领域,方法包括:获取公开文本数据,将所述公开文本数据输入到所述文本组成单元选择模型,确定出所述公开文本数据中多个文本组成单元位置各自对应的第一文本组成单元;将各所述第一文本组成单元,发送至各所述第二设备,以供所述第二设备根据各所述第一文本组成单元进行词表映射,得到各自对应的第二文本组成单元;联合各所述第二设备根据各所述第一文本组成单元和各所述第二文本组成单元,优化所述大语言模型和所述小语言模型,获得训练完成的大语言模型。通过选择文本组成单元来优化模型自然语言处理能力的训练过程,以提高大语言模型的模型处理能力。
技术关键词
大语言模型 语言模型训练方法 数据 计算机程序产品 模型训练设备 自然语言 截断方法 标签文本 对齐方法 处理器 设备通信 教师 学生 可读存储介质 存储器 异构
系统为您推荐了相关专利信息
1
一种超声波水表流量曲线拟合系统
超声波水表 噪声数据采集 神经网络模型 数据采集模块 可视化模块
2
一种视频内容识别自动分类的方法及系统
模态特征 多模态信息融合 深度学习融合 音频特征 学习分类器
3
一种电网统一模型设计方法以及系统
模型设计方法 模型设计系统 结构设计模块 字符串编码方法 配网故障指示器
4
实现红外接收检测与按键检测引脚复用的电路及方法
按键 MOS管 电阻 电路 红外接收头
5
一种可视化智能交互设计系统
交互设计系统 结构设计模块 构建三维场景 三维模型 色域覆盖率
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号