学习TrainDLenGap的隐式机制协助大语言模型开发的方法及系统

AITNT
正文
推荐专利
学习TrainDLenGap的隐式机制协助大语言模型开发的方法及系统
申请号:CN202510755098
申请日期:2025-06-06
公开号:CN120669972A
公开日期:2025-09-19
类型:发明专利
摘要
本发明针对Transformer子模块的数据加载函数调用,识别并命名了TrainDLenGap问题,找到了该问题的原因并命名为隐式机制;本发明构建FuncPLP数据集以表示TrainDLenGap问题,创建TransfClsf分类器以学习FuncPLP数据集的特征;实验结果表明,以原始的十六维FuncPLP数据集为输入,TransfClsf分类器的准确率为100%;本发明使用PCA和tSNE对FuncPLP数据集进行降维操作,生成两个不同的二维数据集,以二维数据集作为TransfClsf分类器的输入,使用四种不同的核方法:线性核,高斯核,Sigmoid核和多项式核,设置超参数C和γ为不同的值,分类器最高准确率为99.2188%;本发明提出TrainDLenGap问题,构建FuncPLP数据集和TransfClsf分类器,有助于程序员快速,准确地开发大语言模型。
技术关键词
大语言模型 机制 数据集构建方法 变量 支持向量机算法 可视方法 子模块 分类器模型 降维方法 多项式 神经网络模型 对象 数据分布 参数 标签 语句 线性
系统为您推荐了相关专利信息
1
基于超短反馈控制机理的谐波补偿方法
谐波补偿方法 数字信号处理单元 谐波补偿装置 谐波失真 反馈算法
2
飞行控制网络的构建方法、控制方法及系统
无人机 深度确定性策略梯度 网络优化策略 执行动作信息 障碍物
3
一种低普朗特数流体外部流动对流换热的计算方法
湍流热通量 计算方法 湍流模型 变量 动能
4
基于RT-DETR的海洋渔场高精度目标检测改进方法
海洋渔场 模块 注意力机制 网络 多视角
5
一种基于信息增强的事件因果关系识别方法
识别方法 节点 标签 注意力机制 关系建模方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号