一种多重权重显著度驱动的大模型混合精度量化的词序列预测方法

正文

推荐专利

申请号：CN202510735007

申请日期：2025-06-04

公开号：CN120597871A

公开日期：2025-09-05

类型：发明专利

摘要

本发明公开了一种多重权重显著度驱动的大模型混合精度量化的词序列预测方法，获取问答数据集，将问答数据集中的文本数据转换为token ID序列；搭建一个加载了基准参数的大语言模型，对大语言模型进行量化处理得到目标函数；将token ID序列输入至目标函数，对于下一个词序列的进行预测，根据概率分布得到最优的词序列预测结果。该方法缓解传统方法因无法适应复杂权重分布而导致的性能下降问题，同时克服动态调整机制缺失引发的模型在不同数据特征和架构设计下的性能波动，最终提升大语言模型在实际部署中的推理速度与预测准确性。

技术关键词

序列预测方法低比特量化方法概率密度函数融合上下文信息注意力参数大语言模型量化误差位置编码信息动态调整机制模拟退火算法度计算方法精度残差矩阵元素划分方法

系统为您推荐了相关专利信息

一种基于自然语言处理的基因组选择方法及系统

自然语言基因深度学习模型注意力机制样本

一种基于多模态模型的无监督船舶检测方法及系统

图片坐标训练集匹配模块船舶检测方法

基于图像识别的海上船舶监测方法和系统

船舶监测方法多任务学习策略图像短波红外波段构建训练集

一种图像编辑方法及装置

图像生成模型注意力样本融合特征图像编辑方法

一种基于大数据分析用于广告推荐的知识图谱构建方法及系统

货架注意力拓扑图时序广告

一种多重权重显著度驱动的大模型混合精度量化的词序列预测方法

站点导航

APP 下载