一种基于大语言模型对抗训练的数据生成与模型优化方法及装置

AITNT
正文
推荐专利
一种基于大语言模型对抗训练的数据生成与模型优化方法及装置
申请号:CN202511184692
申请日期:2025-08-22
公开号:CN121009953A
公开日期:2025-11-25
类型:发明专利
摘要
本发明公开了一种基于大语言模型对抗训练的数据生成与模型优化方法及装置,涉及人工智能技术领域。所述方法包括:获取特定领域的真实训练数据集;分别微调第一和第二大语言模型以得到生成器与判别器;通过交替对抗训练优化生成器与判别器,生成器旨在生成以假乱真的合成数据,判别器旨在精准区分数据真伪;利用训练后的生成器产生高质量合成数据;融合真实与合成数据构建混合训练集;使用混合集微调目标模型,并评估其性能。所述装置包括数据获取、生成器、判别器、对抗训练控制、数据合成、目标模型训练及性能评估模块。本发明有效解决了特定领域标注数据稀缺问题,能生成高质量合成数据,显著提升目标模型在专业任务中的性能与泛化能力。
技术关键词
大语言模型 模型优化方法 模型训练模块 数据获取模块 机器学习模型 人工智能技术 优化装置 指令 处理器 存储器 训练集 标签 控制模块 有效性 语义 参数 专业 样本
系统为您推荐了相关专利信息
1
基于物联网的气溶胶分析仪远程监控系统及方法
气溶胶分析仪 远程监控方法 黑碳气溶胶 物联网网关 远程监控系统
2
一种数据驱动的自适应营销图片生成系统及方法
结构化业务数据 图片生成系统 背景图 元素 视觉
3
一种基于大语言模型的闭源库API依赖关系分析方法
依赖关系分析方法 大语言模型 程序静态分析 对象 指令
4
一种基于检索增强生成的文本指向性图像分割方法及系统
图像分割方法 多模态 文本 实体 互联网
5
检索增强生成的上下文优化方法、问答处理方法及设备
强化学习算法 语句 计算机程序指令 文本 存储计算机程序
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号