摘要
本申请实施例提供一种面向客舱服务的轻量化离线大模型处理方法及装置,涉及计算机技术领域。方法包括:基于在测试集的训练损失,利用量子遗传算法对初始客舱大模型的超参数进行优化搜索,确定最佳超参数组合,并确定最佳超参数组合对应的目标客舱大模型;采用混合精度分层量化策略对目标客舱大模型进行量化处理,得到轻量化客舱大模型;将轻量化客舱大模型以及客舱知识库部署至本地设备,以使本地设备基于轻量化客舱大模型以及客舱知识库处理问答请求。本申请可用于客舱服务场景中,用于解决现有客舱服务专业知识要求高和客舱智能服务中断率高的问题。
技术关键词
客舱
量子遗传算法
超参数
数据嵌入
量化误差
分层
离线
策略
精度
电子设备
可读存储介质
场景
增量更新
注意力机制
答案
处理器
指令
模块
系统为您推荐了相关专利信息
数据处理模型
竖直分量
量化误差
计算机程序产品
分区
虚拟现实交互
VR设备
超参数
深度学习模型
虚拟现实图像
数控机床运行状态
监测方法
时序
数控机床主轴
平滑算法
订单生命周期
多任务神经网络
管理方法
自动化测试脚本
生成测试报告
旋转机械振动信号
BiLSTM模型
旋转机械故障诊断
位置更新
短时傅里叶变换