基于通用大模型面向操作系统的民族语言大模型构建方法及装置

AITNT
正文
推荐专利
基于通用大模型面向操作系统的民族语言大模型构建方法及装置
申请号:CN202411948970
申请日期:2024-12-27
公开号:CN119886119B
公开日期:2025-11-07
类型:发明专利
摘要
本申请公开了一种基于通用大模型面向操作系统的民族语言大模型构建方法及装置,适用于部署到操作系统,属于信息技术领域。首先,使用预训练语言模型将输入的低资源民族语言中的单词转换成词嵌入表示,得到词嵌入向量,再将词嵌入向量送入投影层,形成可对齐的嵌入表示向量,在训练语料的词表中,获取嵌入表示向量合适的词嵌入向量并映射到大模型语义空间上完成低资源民族语言到高资源民族语言的映射其次,将完成映射的高资源民族语言和低资源民族语言对应的训练语料输入通用大模型,输出为对应的词嵌入表示。为提高模型民族语言输出能力,将对应的词嵌入表示输入多语言生成层得到最终嵌入表示,通过预训练语言模型根据最终嵌入表示进行迭代更新,实现从高资源民族语言到低资源民族语言的映射。此外,还对整体模型进行指令微调,实现用户的指令并增强大模型的能力和可控性。
技术关键词
预训练语言模型 面向操作系统 词嵌入向量 多语言 多头注意力机制 模型构建方法 资源 网络 模型构建装置 编码 非线性 可读存储介质 模块 语义 矩阵 计算机 标识
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号