一种基于哈希码的大模型键值型知识学习方法

正文

推荐专利

申请号：CN202410994137

申请日期：2024-07-24

公开号：CN119026677A

公开日期：2024-11-26

类型：发明专利

摘要

本发明公开了一种基于哈希码的大模型键值型知识学习方法，旨在提高预训练大语言模型在键值式问答上的准确率；该方法包括：在原始的键值问答训练集中，基于键通过特定算法计算生成每个键值对所对应的哈希码；将哈希码加入训练集中对应的每条键值对的键与值之前，用加入哈希码后的改进数据集对模型进行全量微调；推理时，用同样的算法在需要作为输入的键上进行哈希码的计算复原，拼接于键前，输入模型，获得推理解码结果。本发明通过在数据集中引入基于键计算得出的哈希码，缓解了目前大模型有监督微调在键值问答上的准确率随数据集规模增大而下降的问题，提出了更普适于大模型在键值式问答任务上的微调算法，在多个相关数据集上的微调效果均获得了显著提升。

技术关键词

知识学习方法键值加密算法训练集解码大语言模型字符数据策略集束规模格式

系统为您推荐了相关专利信息

一种基于状态空间模型网络提升医学图像分割的方法

状态空间模型网络解码器医学图像分割技术通道注意力机制

基于摄像头多次解码推屏的小内存屏显方法、装置及系统

屏显方法屏显装置主控芯片显示屏内存

一种电力变压器故障识别方法

电力变压器故障识别方法信号特征网络概率密度函数

一种基于点集优化算法和变分量化自编码器的区域划分策略的三维重建方法

三维重建方法编码器三维重建模型算法棋盘格图像

一种基于扩散模型的零样本文本驱动视频编辑方法

视频编辑方法文本视频帧 Softmax函数视频编辑技术

一种基于哈希码的大模型键值型知识学习方法

站点导航

APP 下载