跨语言迁移语言模型的方法、装置、设备及存储介质

AITNT
正文
推荐专利
跨语言迁移语言模型的方法、装置、设备及存储介质
申请号:CN202510180316
申请日期:2025-02-18
公开号:CN120124643A
公开日期:2025-06-10
类型:发明专利
摘要
本公开提供了一种跨语言迁移语言模型的方法、装置、设备及存储介质,属于计算机技术领域。该方法包括:获取伪平行语料;在所述第一模型的各个层中添加第一前馈神经网络,得到第二模型;基于所述伪平行语料对所述第二模型进行训练。上述方案通过用第一语言的词汇和第二语言的词汇构建伪平行语料,显著降低了数据获取和标注的成本,解决了平行语料的标注成本高昂的问题。并且,由于该伪平行语料包括第一语言的词汇和第二语言的词汇,且第一模型中添加的第一前馈神经网络用于处理第二语言,第一模型中原有的第二前馈神经网络用于处理第一语言,因此训练得到的第二模型在第二语言下具有较好的能力,也即实现了较好的迁移效果。
技术关键词
前馈神经网络 文本 样本 电子设备 可执行程序代码 处理器 可读存储介质 计算机程序产品 数据 参数 分词 存储器 指令
系统为您推荐了相关专利信息
1
基于深度学习的细胞应力分析方法及其应用
细胞结构模型 应力分析方法 应力分析模型 轨迹 特征值
2
一种基于二人零和博弈的智能电网虚假数据注入攻击防御方法
攻击防御方法 节点 母线 构建智能电网 参数更新方法
3
多模型协同知识图谱构建方法、系统、设备及存储介质
知识图谱构建方法 有向无环图 多模型协同 知识图谱数据库 命名实体识别模型
4
一种颅内未破裂动脉瘤血流导向治疗后闭塞预测方法
血流动力学参数 血流导向装置 资料 机器学习算法 变量
5
一种自动化测试用例的生成与执行方法及其系统
自动化测试用例 生成测试用例 测试用例编写 代码覆盖率分析 脚本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号