基于数据驱动正则的问答大语言模型的问答方法及产品

AITNT
正文
推荐专利
基于数据驱动正则的问答大语言模型的问答方法及产品
申请号:CN202510828333
申请日期:2025-06-20
公开号:CN120336497B
公开日期:2025-10-28
类型:发明专利
摘要
本申请涉及人工智能技术领域,公开了一种基于数据驱动正则的问答大语言模型的问答方法及产品。该方法包括:获取待部署目标问答大语言模型的目标设备的设备参数值,确定预训练的原始问答大语言模型的需要剪枝的通道;基于问答样本数据,利用带有正则损失项的损失函数对预训练的原始问答大语言模型进行模型参数更新;按照需要剪枝的通道对经过模型参数更新后的问答大语言模型进行通道剪枝,基于经过通道剪枝后的问答大语言模型得到目标问答大语言模型;针对来自于目标设备的问题,通过目标问答大语言模型进行推理,得到答案。采用本方法能够在减少大语言模型的规模的同时保持模型性能,便于将大语言模型部署到轻量级设备。
技术关键词
大语言模型 通道剪枝 矩阵 问答方法 答案 注意力机制 参数 索引 数据 样本 前馈神经网络 代表 表达式 元素 模块 人工智能技术 问答系统 客户端
系统为您推荐了相关专利信息
1
一种基于卷积神经网络的核磁共振波谱代谢组学分析方法
代谢组学分析方法 核磁共振波谱 核磁共振氢谱 深度学习模型 样本
2
基于时空大数据的地表形变趋势预测方法及系统
监测点 拓扑网络 注意力 时空大数据 时空序列数据
3
一种非圆轮廓零件位置域高精度车削加工方法、装置及介质
旋转系统 非圆轮廓零件 模型预测控制器 状态空间模型 车削
4
用于开关柜的氦检漏方法和系统
矩阵 拓扑特征 检漏方法 多尺度 数据
5
基于病理报告和TNM标准的大模型智能TNM分期系统构建方法
系统构建方法 报告 问答系统 数据 多模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号