摘要
本申请公开了一种行业大模型的内容安全检测模块的显存优化方法、装置、设备及介质,涉及人工智能技术领域,包括:加载待量化行业大模型并获取量化参数;加载待使用数据,利用分词器对待使用数据分词得到分词后数据,联立分词后数据和待量化行业大模型得到目标行业大模型;根据量化公式并基于量化参数将目标行业大模型的模型权重值和模型激活值由第一位宽的浮点数据转换为第二位宽的整点数据得到内容安全检测模块的显存降低至目标数值的量化后模型;量化参数包括第二位宽和偏移量;第二位宽小于第一位宽;若量化后模型的评估精度不满足精度要求,调整量化参数,跳转至量化步骤直至最新评估精度满足精度要求。能够实现显存优化并确保模型准确性。
技术关键词
分词
数据
参数
精度
模块
人工智能技术
优化装置
数值
可读存储介质
处理器
电子设备
金融
存储器
计算机
因子
噪声
系统为您推荐了相关专利信息
卡尔曼滤波算法
障碍物
通信模块
无人机飞行轨迹
风险
设备故障定位方法
检测设备
历史故障数据
决策树算法
故障定位系统
通风空调风管
控制平台
污染程度判断
远程监控模块
清洗策略
新能源汽车动力
系统优化控制方法
方向盘
神经网络模型
车辆