一种基于大模型多阶段数据增强的跨语言简讯生成方法

正文

推荐专利

申请号：CN202410726533

申请日期：2024-06-06

公开号：CN118821796A

公开日期：2024-10-22

类型：发明专利

摘要

本发明涉及一种基于大模型多阶段数据增强的跨语言简讯生成方法，属于计算机自然语言处理技术领域。本方法通过指令微调技术，利用英文原文和中文简讯之间的对应关系，生成适合大模型学习的指令微调语料。本发明将大模型应用于跨语言科技简讯生成领域，以及结合多阶段数据增强框架，提高了模型在特定任务上的表现，同时保持了模型的泛化能力，解决了传统跨语言文本摘要任务样本不足等问题，避免了传统跨语言任务流水线方法中的误差传播，能够更快地进行推理。本方法通过串行结构学习多个相关任务，并通过辅助任务数据进行增强，从共享的知识中受益，提高了性能，增强泛化能力，有效应对数据稀缺性。

技术关键词

多阶段生成方法摘要机器翻译计算机自然语言跨语言科技数据指令机器学习框架流水线方法矩阵序列模型预训练参数微调技术模板预训练模型中文文本

系统为您推荐了相关专利信息

基于少样本学习的大语言模型的图到文本生成方法及装置

样本文本生成方法文本生成模型投影器大语言模型

能源管理场景生成方法、系统以及可读存储介质

能源管理场景生成方法模型库编辑支持用户自定义

用于电力电缆沟道无线自组织通信的数据传输方法及系统

电力电缆沟道数据传输方法信道邻居链路

视频生成方法、展示方法、设备、存储介质及程序产品

生成指令视频生成方法图像生成模型文本客户端

用于汽车软件的信息安全处理方法、装置及电子设备

文件包源程序非对称加密算法解密车辆软件升级

一种基于大模型多阶段数据增强的跨语言简讯生成方法

站点导航

APP 下载