摘要
本发明公开了一种多重权重显著度驱动的大模型混合精度量化的词序列预测方法,获取问答数据集,将问答数据集中的文本数据转换为token ID序列;搭建一个加载了基准参数的大语言模型,对大语言模型进行量化处理得到目标函数;将token ID序列输入至目标函数,对于下一个词序列的进行预测,根据概率分布得到最优的词序列预测结果。该方法缓解传统方法因无法适应复杂权重分布而导致的性能下降问题,同时克服动态调整机制缺失引发的模型在不同数据特征和架构设计下的性能波动,最终提升大语言模型在实际部署中的推理速度与预测准确性。
技术关键词
序列预测方法
低比特量化方法
概率密度函数
融合上下文信息
注意力
参数
大语言模型
量化误差
位置编码信息
动态调整机制
模拟退火算法
度计算方法
精度
残差矩阵
元素
划分方法
系统为您推荐了相关专利信息
船舶监测方法
多任务学习策略
图像
短波红外波段
构建训练集
图像生成模型
注意力
样本
融合特征
图像编辑方法