学习TrainDLenGap的隐式机制协助大语言模型开发的方法及系统

正文

推荐专利

申请号：CN202510755098

申请日期：2025-06-06

公开号：CN120669972A

公开日期：2025-09-19

类型：发明专利

摘要

本发明针对Transformer子模块的数据加载函数调用，识别并命名了TrainDLenGap问题，找到了该问题的原因并命名为隐式机制；本发明构建FuncPLP数据集以表示TrainDLenGap问题，创建TransfClsf分类器以学习FuncPLP数据集的特征；实验结果表明，以原始的十六维FuncPLP数据集为输入，TransfClsf分类器的准确率为100%；本发明使用PCA和tSNE对FuncPLP数据集进行降维操作，生成两个不同的二维数据集，以二维数据集作为TransfClsf分类器的输入，使用四种不同的核方法：线性核，高斯核，Sigmoid核和多项式核，设置超参数C和γ为不同的值，分类器最高准确率为99.2188%；本发明提出TrainDLenGap问题，构建FuncPLP数据集和TransfClsf分类器，有助于程序员快速，准确地开发大语言模型。

技术关键词

大语言模型机制数据集构建方法变量支持向量机算法可视方法子模块分类器模型降维方法多项式神经网络模型对象数据分布参数标签语句线性

系统为您推荐了相关专利信息

基于超短反馈控制机理的谐波补偿方法

谐波补偿方法数字信号处理单元谐波补偿装置谐波失真反馈算法

飞行控制网络的构建方法、控制方法及系统

无人机深度确定性策略梯度网络优化策略执行动作信息障碍物

一种低普朗特数流体外部流动对流换热的计算方法

湍流热通量计算方法湍流模型变量动能

基于RT-DETR的海洋渔场高精度目标检测改进方法

海洋渔场模块注意力机制网络多视角

一种基于信息增强的事件因果关系识别方法

识别方法节点标签注意力机制关系建模方法

学习TrainDLenGap的隐式机制协助大语言模型开发的方法及系统

站点导航

APP 下载