摘要
本申请涉及人工智能技术领域,公开了一种基于数据驱动正则的问答大语言模型的问答方法及产品。该方法包括:获取待部署目标问答大语言模型的目标设备的设备参数值,确定预训练的原始问答大语言模型的需要剪枝的通道;基于问答样本数据,利用带有正则损失项的损失函数对预训练的原始问答大语言模型进行模型参数更新;按照需要剪枝的通道对经过模型参数更新后的问答大语言模型进行通道剪枝,基于经过通道剪枝后的问答大语言模型得到目标问答大语言模型;针对来自于目标设备的问题,通过目标问答大语言模型进行推理,得到答案。采用本方法能够在减少大语言模型的规模的同时保持模型性能,便于将大语言模型部署到轻量级设备。
技术关键词
大语言模型
通道剪枝
矩阵
问答方法
答案
注意力机制
参数
索引
数据
样本
前馈神经网络
代表
表达式
元素
模块
人工智能技术
问答系统
客户端
系统为您推荐了相关专利信息
代谢组学分析方法
核磁共振波谱
核磁共振氢谱
深度学习模型
样本
监测点
拓扑网络
注意力
时空大数据
时空序列数据
旋转系统
非圆轮廓零件
模型预测控制器
状态空间模型
车削