摘要
本发明提供一种基于小型化大语言模型的文本问答方法及装置,涉及人工智能技术领域,方法包括:获取输入文本;将输入文本输入至小型化大语言模型中,得到小型化大语言模型输出的预测答复;其中,小型化大语言模型是利用限定领域监督式微调SFT数据对大语言模型进行微调,并结合模型微调结果对微调后的模型进行剪枝,以及利用通用SFT数据对剪枝后的模型进行微调,并结合剪枝模型微调结果对微调后的剪枝后的模型进行剪枝得到的。本发明通过利用限定领域SFT数据和通用SFT数据分别对大语言模型进行微调和剪枝,使得模型在适应特定领域的语言特点和知识需求的同时,遗忘通用知识中的重要参数,减少模型的参数量和计算复杂度。
技术关键词
剪枝模型
大语言模型
权重分配策略
问答方法
文本
参数
生成规则
矩阵
信号
非暂态计算机可读存储介质
命名实体识别
处理器
问答装置
分词
人工智能技术
数据获取模块
计算机程序产品
系统为您推荐了相关专利信息
智能研判方法
日志
大语言模型
编码器
深度学习模型
大语言模型
攻击检测方法
风险
语义
攻击检测装置