摘要
本发明涉及人工智能和自然语言处理技术领域,具体公开了一种中英文混合教学模型构建方法、教学方法及存储介质,包括:根据基础大语言模型进行基于正交约束机制的训练,获得混合语言训练模型,基于正交约束机制的训练至少包括对基础大语言模型加载与中英文混合教学功能适配的低秩适配器,并对除基础大语言模型之外的低秩适配器的权重参数构造正交损失项后进行增量式训练;构建中英文数据集,并对其进行基于混合语言训练模型适配的预处理;将预处理中英文数据集输入至混合语言训练模型中进行混合教学训练。本发明提供的中英文混合教学模型构建方法不仅能够解决中英文教学模型在多任务交互场景中存在的灾难性遗忘还能够平衡训练效率与资源消耗。
技术关键词
教学模型
大语言模型
适配器
增量更新
教学方法
机制
基础
数据
表达式
参数
自然语言
动态
多任务
计算机
矩阵
指令
处理器
场景
资源
系统为您推荐了相关专利信息
大语言模型
生成结构化信息
生成回复信息
分析模块
时间段
生成视频封面
视频封面生成方法
视频帧集合
背景图
实体
测试用例构建方法
航空设备
航空机电设备
构建知识图谱
框架