摘要
本发明涉及一种基于大模型多阶段数据增强的跨语言简讯生成方法,属于计算机自然语言处理技术领域。本方法通过指令微调技术,利用英文原文和中文简讯之间的对应关系,生成适合大模型学习的指令微调语料。本发明将大模型应用于跨语言科技简讯生成领域,以及结合多阶段数据增强框架,提高了模型在特定任务上的表现,同时保持了模型的泛化能力,解决了传统跨语言文本摘要任务样本不足等问题,避免了传统跨语言任务流水线方法中的误差传播,能够更快地进行推理。本方法通过串行结构学习多个相关任务,并通过辅助任务数据进行增强,从共享的知识中受益,提高了性能,增强泛化能力,有效应对数据稀缺性。
技术关键词
多阶段
生成方法
摘要
机器翻译
计算机自然语言
跨语言科技
数据
指令
机器学习框架
流水线方法
矩阵
序列
模型预训练
参数
微调技术
模板
预训练模型
中文文本
系统为您推荐了相关专利信息
样本
文本生成方法
文本生成模型
投影器
大语言模型
能源管理
场景生成方法
模型库
编辑
支持用户自定义
生成指令
视频生成方法
图像生成模型
文本
客户端
文件包
源程序
非对称加密算法
解密
车辆软件升级