一种基于大语言模型对抗训练的数据生成与模型优化方法及装置

正文

推荐专利

申请号：CN202511184692

申请日期：2025-08-22

公开号：CN121009953A

公开日期：2025-11-25

类型：发明专利

摘要

本发明公开了一种基于大语言模型对抗训练的数据生成与模型优化方法及装置，涉及人工智能技术领域。所述方法包括：获取特定领域的真实训练数据集；分别微调第一和第二大语言模型以得到生成器与判别器；通过交替对抗训练优化生成器与判别器，生成器旨在生成以假乱真的合成数据，判别器旨在精准区分数据真伪；利用训练后的生成器产生高质量合成数据；融合真实与合成数据构建混合训练集；使用混合集微调目标模型，并评估其性能。所述装置包括数据获取、生成器、判别器、对抗训练控制、数据合成、目标模型训练及性能评估模块。本发明有效解决了特定领域标注数据稀缺问题，能生成高质量合成数据，显著提升目标模型在专业任务中的性能与泛化能力。

技术关键词

大语言模型模型优化方法模型训练模块数据获取模块机器学习模型人工智能技术优化装置指令处理器存储器训练集标签控制模块有效性语义参数专业样本

系统为您推荐了相关专利信息

基于物联网的气溶胶分析仪远程监控系统及方法

气溶胶分析仪远程监控方法黑碳气溶胶物联网网关远程监控系统

一种数据驱动的自适应营销图片生成系统及方法

结构化业务数据图片生成系统背景图元素视觉

一种基于大语言模型的闭源库API依赖关系分析方法

依赖关系分析方法大语言模型程序静态分析对象指令

一种基于检索增强生成的文本指向性图像分割方法及系统

图像分割方法多模态文本实体互联网

检索增强生成的上下文优化方法、问答处理方法及设备

强化学习算法语句计算机程序指令文本存储计算机程序

一种基于大语言模型对抗训练的数据生成与模型优化方法及装置

站点导航

APP 下载