大语言模型的压缩监督方法、装置、设备、介质及产品

AITNT
正文
推荐专利
大语言模型的压缩监督方法、装置、设备、介质及产品
申请号:CN202410777840
申请日期:2024-06-17
公开号:CN118798388A
公开日期:2024-10-18
类型:发明专利
摘要
本申请涉及大语言模型技术领域,特别涉及一种大语言模型的压缩监督方法、装置、设备、介质及产品,其中,方法包括:获取文本数据,其中,文本数据为包括多个字符或句子的文本数据;将文本数据输入大语言模型,大语言模型输出回答数据;根据文本数据和回答数据生成监督数据集,基于监督数据集对大语言模型进行模型压缩,并基于回答数据监督大语言模型的模型压缩过程,以得到与大语言模型对应的目标压缩模型。由此,解决了相关技术中模型压缩的校准数据集直接使用人工编写的通用语言建模数据,且直接使用人工响应进行监督,导致模型压缩的性能下降,准确性较低等问题。
技术关键词
大语言模型 模型压缩 数据 文本 监督装置 计算机程序产品 字符 处理器 指令 输入模块 可读存储介质 存储器 电子设备 摘要 校准
系统为您推荐了相关专利信息
1
基于区块链的电网电力调度方法、系统、介质及设备
电力调度系统 报告 电力调度方法 数据采集模块 决策
2
一种面向不完备SCADA场景多元传感器数据的攻击检测方法
多元传感器 攻击检测方法 定义 场景 多元时序数据
3
意图分发方法、装置、设备、存储介质及程序产品
金融 意图识别模型 实体 问答系统 分发装置
4
一种光伏跟踪支架的故障检测方法及相关设备
光伏跟踪支架 历史运行数据 故障检测方法 风速 曲线
5
虚拟主站自动验收与配置错误定位系统及方法
数据通信网关机 模拟保护测控装置 测试工具 调控主站 错误定位方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号