一种多重权重显著度驱动的大模型混合精度量化的词序列预测方法

AITNT
正文
推荐专利
一种多重权重显著度驱动的大模型混合精度量化的词序列预测方法
申请号:CN202510735007
申请日期:2025-06-04
公开号:CN120597871A
公开日期:2025-09-05
类型:发明专利
摘要
本发明公开了一种多重权重显著度驱动的大模型混合精度量化的词序列预测方法,获取问答数据集,将问答数据集中的文本数据转换为token ID序列;搭建一个加载了基准参数的大语言模型,对大语言模型进行量化处理得到目标函数;将token ID序列输入至目标函数,对于下一个词序列的进行预测,根据概率分布得到最优的词序列预测结果。该方法缓解传统方法因无法适应复杂权重分布而导致的性能下降问题,同时克服动态调整机制缺失引发的模型在不同数据特征和架构设计下的性能波动,最终提升大语言模型在实际部署中的推理速度与预测准确性。
技术关键词
序列预测方法 低比特量化方法 概率密度函数 融合上下文信息 注意力 参数 大语言模型 量化误差 位置编码信息 动态调整机制 模拟退火算法 度计算方法 精度 残差矩阵 元素 划分方法
系统为您推荐了相关专利信息
1
一种基于自然语言处理的基因组选择方法及系统
自然语言 基因 深度学习模型 注意力机制 样本
2
一种基于多模态模型的无监督船舶检测方法及系统
图片 坐标 训练集 匹配模块 船舶检测方法
3
基于图像识别的海上船舶监测方法和系统
船舶监测方法 多任务学习策略 图像 短波红外波段 构建训练集
4
一种图像编辑方法及装置
图像生成模型 注意力 样本 融合特征 图像编辑方法
5
一种基于大数据分析用于广告推荐的知识图谱构建方法及系统
货架 注意力 拓扑图 时序 广告
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号