一种基于transformer模型的精度调优方法、系统、设备及存储介质

正文

推荐专利

申请号：CN202411963191

申请日期：2024-12-30

公开号：CN119886346B

公开日期：2025-11-18

类型：发明专利

摘要

本发明公开一种基于transformer模型的精度调优方法、系统、设备及存储介质，通过启发式地迭代搜索混合精度策略快速恢复transformer模型的精度，获得与全精度模型精度基本对齐的FP32+FP16混合模型，同时也能够保证推理性能与原始FP16模型接近，该方法是一种基于启发式迭代搜索的混合精度配置方法，用于优化transformer模型的精度和推理性能，在精度调优的同时能够在FP16精度部署上保持与全FP16模型接近的推理性能；通过按层类型选择FP32网络层的启发式策略，以保持模型的精度；结合cos相似度指标和预设相似度阈值的模型精度与性能评估机制，保证精度调优的结果；同时，能够在不同NVIDIA芯片平台上运行，兼容性好。

技术关键词

调优方法精度配置方法输出模块启发式策略无标签样本平台通信接口存储计算机程序存储器处理器数据数值格式指标表达式芯片电子设备

系统为您推荐了相关专利信息

反应堆模型联合仿真系统和方法

Simulink模型联合仿真系统接口模块反应堆通信协议单元

基于大语言模型的手术操作记录自动编码方法及系统

大语言模型自动编码方法手术文本自动编码系统

一种基于深度学习的小目标图像识别方法

图像识别方法图像识别系统图像识别准确率网络模型训练数据获取模块

基于机器视觉的轨道交通车站障碍物监测方法及装置

监控视频融合障碍物识别轻量级深度学习车站特征金字塔网络

阻抗扫描装置

电池储能系统工况参数扫描装置信号生成器人机交互模块

一种基于transformer模型的精度调优方法、系统、设备及存储介质

站点导航

APP 下载