一种基于大模型多阶段数据增强的跨语言简讯生成方法

AITNT
正文
推荐专利
一种基于大模型多阶段数据增强的跨语言简讯生成方法
申请号:CN202410726533
申请日期:2024-06-06
公开号:CN118821796A
公开日期:2024-10-22
类型:发明专利
摘要
本发明涉及一种基于大模型多阶段数据增强的跨语言简讯生成方法,属于计算机自然语言处理技术领域。本方法通过指令微调技术,利用英文原文和中文简讯之间的对应关系,生成适合大模型学习的指令微调语料。本发明将大模型应用于跨语言科技简讯生成领域,以及结合多阶段数据增强框架,提高了模型在特定任务上的表现,同时保持了模型的泛化能力,解决了传统跨语言文本摘要任务样本不足等问题,避免了传统跨语言任务流水线方法中的误差传播,能够更快地进行推理。本方法通过串行结构学习多个相关任务,并通过辅助任务数据进行增强,从共享的知识中受益,提高了性能,增强泛化能力,有效应对数据稀缺性。
技术关键词
多阶段 生成方法 摘要 机器翻译 计算机自然语言 跨语言科技 数据 指令 机器学习框架 流水线方法 矩阵 序列 模型预训练 参数 微调技术 模板 预训练模型 中文文本
系统为您推荐了相关专利信息
1
基于少样本学习的大语言模型的图到文本生成方法及装置
样本 文本生成方法 文本生成模型 投影器 大语言模型
2
能源管理场景生成方法、系统以及可读存储介质
能源管理 场景生成方法 模型库 编辑 支持用户自定义
3
用于电力电缆沟道无线自组织通信的数据传输方法及系统
电力电缆沟道 数据传输方法 信道 邻居 链路
4
视频生成方法、展示方法、设备、存储介质及程序产品
生成指令 视频生成方法 图像生成模型 文本 客户端
5
用于汽车软件的信息安全处理方法、装置及电子设备
文件包 源程序 非对称加密算法 解密 车辆软件升级
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号