基于小型化大语言模型的文本问答方法及装置

正文

推荐专利

申请号：CN202411369713

申请日期：2024-09-29

公开号：CN118885597B

公开日期：2025-02-07

类型：发明专利

摘要

本发明提供一种基于小型化大语言模型的文本问答方法及装置，涉及人工智能技术领域，方法包括：获取输入文本；将输入文本输入至小型化大语言模型中，得到小型化大语言模型输出的预测答复；其中，小型化大语言模型是利用限定领域监督式微调SFT数据对大语言模型进行微调，并结合模型微调结果对微调后的模型进行剪枝，以及利用通用SFT数据对剪枝后的模型进行微调，并结合剪枝模型微调结果对微调后的剪枝后的模型进行剪枝得到的。本发明通过利用限定领域SFT数据和通用SFT数据分别对大语言模型进行微调和剪枝，使得模型在适应特定领域的语言特点和知识需求的同时，遗忘通用知识中的重要参数，减少模型的参数量和计算复杂度。

技术关键词

剪枝模型大语言模型权重分配策略问答方法文本参数生成规则矩阵信号非暂态计算机可读存储介质命名实体识别处理器问答装置分词人工智能技术数据获取模块计算机程序产品

系统为您推荐了相关专利信息

一种基于大语言模型的Nginx日志智能研判方法

智能研判方法日志大语言模型编码器深度学习模型

代码审计方法、装置、电子设备、存储介质及程序产品

代码审计方法审计设备模块大语言模型样本

一种流程编排方法、存储介质、程序产品及电子设备

编排方法文本预训练模型协议接口

一种大语言模型的提示词攻击检测方法和装置

大语言模型攻击检测方法风险语义攻击检测装置

使用扩散进行合成图像增强的上下文保留

文本像素对象光学字符识别处理器

基于小型化大语言模型的文本问答方法及装置

站点导航

APP 下载