一种轻量级中英双语大语言模型的两阶段训练方法

AITNT
正文
推荐专利
一种轻量级中英双语大语言模型的两阶段训练方法
申请号:CN202411485750
申请日期:2024-10-23
公开号:CN119514636A
公开日期:2025-02-25
类型:发明专利
摘要
本申请提供一种轻量级中英双语大语言模型的两阶段训练方法,方法包括:步骤1,进行中英文训练数据收集与预处理;预处理流程包括特殊标记清除,敏感数据清理、数据去重、去除广告、格式化处理;步骤2,第一阶段高资源语言训练,即利用英语进行模型训练;步骤3,进行第二阶段双语混合训练,采用语言迁移训练,将中文数据和英文数据混杂进行第二阶段训练;其中,步骤3包括:步骤31,进行词表扩展;步骤32,语言迁移训练。本申请能够提高双语处理能力。
技术关键词
数据 局部注意力机制 主题 文本 残差网络 分词算法 大语言模型 广告 字符 格式化 序列 编码 LDA算法 LDA模型 英语 掩码矩阵
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号