基于数据驱动正则的问答大语言模型的问答方法及产品

正文

推荐专利

申请号：CN202510828333

申请日期：2025-06-20

公开号：CN120336497B

公开日期：2025-10-28

类型：发明专利

摘要

本申请涉及人工智能技术领域，公开了一种基于数据驱动正则的问答大语言模型的问答方法及产品。该方法包括：获取待部署目标问答大语言模型的目标设备的设备参数值，确定预训练的原始问答大语言模型的需要剪枝的通道；基于问答样本数据，利用带有正则损失项的损失函数对预训练的原始问答大语言模型进行模型参数更新；按照需要剪枝的通道对经过模型参数更新后的问答大语言模型进行通道剪枝，基于经过通道剪枝后的问答大语言模型得到目标问答大语言模型；针对来自于目标设备的问题，通过目标问答大语言模型进行推理，得到答案。采用本方法能够在减少大语言模型的规模的同时保持模型性能，便于将大语言模型部署到轻量级设备。

技术关键词

大语言模型通道剪枝矩阵问答方法答案注意力机制参数索引数据样本前馈神经网络代表表达式元素模块人工智能技术问答系统客户端

系统为您推荐了相关专利信息

一种基于卷积神经网络的核磁共振波谱代谢组学分析方法

代谢组学分析方法核磁共振波谱核磁共振氢谱深度学习模型样本

基于时空大数据的地表形变趋势预测方法及系统

监测点拓扑网络注意力时空大数据时空序列数据

一种非圆轮廓零件位置域高精度车削加工方法、装置及介质

旋转系统非圆轮廓零件模型预测控制器状态空间模型车削

用于开关柜的氦检漏方法和系统

矩阵拓扑特征检漏方法多尺度数据

基于病理报告和TNM标准的大模型智能TNM分期系统构建方法

系统构建方法报告问答系统数据多模型

基于数据驱动正则的问答大语言模型的问答方法及产品

站点导航

APP 下载