摘要
本发明公开一种基于熵项影响的生成对抗网络数据扩充方法及大语言模型,所述大语言模型包括大语言模块、多智能体模块、知识库与推理引擎及实时交互接口;大语言模型使用预训练语言模型作为主控,用于处理用户输入的自然语言理解与生成;多智能体模块部署由多个功能性智能体,用于各自独立完成特定任务;知识库与推理引擎存储有领域专用知识;实时交互接口用于提供用户与系统交互的入口。其中,基于熵项影响的生成对抗网络数据扩充方法进行数据扩充,然后输入到预训练语言模型进行训练。本发明提升了大预言模型在稀缺类别数据生成上的性能和数据分布模拟能力,同时实现了模块化、并行化的高效任务处理。
技术关键词
数据扩充方法
多头注意力机制
预训练语言模型
解码器
样本
语言模块
交叉注意力机制
编码器
自然语言理解
特征权重学习
生成对抗网络模型
Softmax函数
大语言模型
多智能体协同
数据分布
系统为您推荐了相关专利信息
依存句法分析
融合特征
情感分析方法
解析句子
编码
成效评估方法
评估指标体系
物联
机器学习样本数据
终端能力信息
动态特征提取
群方法
数据拟合模型
灵敏度分析法
直驱风电机组