基于小型化大语言模型的文本问答方法及装置

AITNT
正文
推荐专利
基于小型化大语言模型的文本问答方法及装置
申请号:CN202411369713
申请日期:2024-09-29
公开号:CN118885597B
公开日期:2025-02-07
类型:发明专利
摘要
本发明提供一种基于小型化大语言模型的文本问答方法及装置,涉及人工智能技术领域,方法包括:获取输入文本;将输入文本输入至小型化大语言模型中,得到小型化大语言模型输出的预测答复;其中,小型化大语言模型是利用限定领域监督式微调SFT数据对大语言模型进行微调,并结合模型微调结果对微调后的模型进行剪枝,以及利用通用SFT数据对剪枝后的模型进行微调,并结合剪枝模型微调结果对微调后的剪枝后的模型进行剪枝得到的。本发明通过利用限定领域SFT数据和通用SFT数据分别对大语言模型进行微调和剪枝,使得模型在适应特定领域的语言特点和知识需求的同时,遗忘通用知识中的重要参数,减少模型的参数量和计算复杂度。
技术关键词
剪枝模型 大语言模型 权重分配策略 问答方法 文本 参数 生成规则 矩阵 信号 非暂态计算机可读存储介质 命名实体识别 处理器 问答装置 分词 人工智能技术 数据获取模块 计算机程序产品
系统为您推荐了相关专利信息
1
一种基于大语言模型的Nginx日志智能研判方法
智能研判方法 日志 大语言模型 编码器 深度学习模型
2
代码审计方法、装置、电子设备、存储介质及程序产品
代码审计方法 审计设备 模块 大语言模型 样本
3
一种流程编排方法、存储介质、程序产品及电子设备
编排方法 文本 预训练模型 协议 接口
4
一种大语言模型的提示词攻击检测方法和装置
大语言模型 攻击检测方法 风险 语义 攻击检测装置
5
使用扩散进行合成图像增强的上下文保留
文本 像素 对象 光学字符识别 处理器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号