摘要
本公开提供了一种跨语言迁移语言模型的方法、装置、设备及存储介质,属于计算机技术领域。该方法包括:获取伪平行语料;在所述第一模型的各个层中添加第一前馈神经网络,得到第二模型;基于所述伪平行语料对所述第二模型进行训练。上述方案通过用第一语言的词汇和第二语言的词汇构建伪平行语料,显著降低了数据获取和标注的成本,解决了平行语料的标注成本高昂的问题。并且,由于该伪平行语料包括第一语言的词汇和第二语言的词汇,且第一模型中添加的第一前馈神经网络用于处理第二语言,第一模型中原有的第二前馈神经网络用于处理第一语言,因此训练得到的第二模型在第二语言下具有较好的能力,也即实现了较好的迁移效果。
技术关键词
前馈神经网络
文本
样本
电子设备
可执行程序代码
处理器
可读存储介质
计算机程序产品
数据
参数
分词
存储器
指令
系统为您推荐了相关专利信息
细胞结构模型
应力分析方法
应力分析模型
轨迹
特征值
攻击防御方法
节点
母线
构建智能电网
参数更新方法
知识图谱构建方法
有向无环图
多模型协同
知识图谱数据库
命名实体识别模型
血流动力学参数
血流导向装置
资料
机器学习算法
变量
自动化测试用例
生成测试用例
测试用例编写
代码覆盖率分析
脚本