一种基于哈希码的大模型键值型知识学习方法

AITNT
正文
推荐专利
一种基于哈希码的大模型键值型知识学习方法
申请号:CN202410994137
申请日期:2024-07-24
公开号:CN119026677A
公开日期:2024-11-26
类型:发明专利
摘要
本发明公开了一种基于哈希码的大模型键值型知识学习方法,旨在提高预训练大语言模型在键值式问答上的准确率;该方法包括:在原始的键值问答训练集中,基于键通过特定算法计算生成每个键值对所对应的哈希码;将哈希码加入训练集中对应的每条键值对的键与值之前,用加入哈希码后的改进数据集对模型进行全量微调;推理时,用同样的算法在需要作为输入的键上进行哈希码的计算复原,拼接于键前,输入模型,获得推理解码结果。本发明通过在数据集中引入基于键计算得出的哈希码,缓解了目前大模型有监督微调在键值问答上的准确率随数据集规模增大而下降的问题,提出了更普适于大模型在键值式问答任务上的微调算法,在多个相关数据集上的微调效果均获得了显著提升。
技术关键词
知识学习方法 键值 加密算法 训练集 解码 大语言模型 字符 数据 策略 集束 规模 格式
系统为您推荐了相关专利信息
1
一种基于状态空间模型网络提升医学图像分割的方法
状态空间模型 网络 解码器 医学图像分割技术 通道注意力机制
2
基于摄像头多次解码推屏的小内存屏显方法、装置及系统
屏显方法 屏显装置 主控芯片 显示屏 内存
3
一种电力变压器故障识别方法
电力变压器故障 识别方法 信号特征 网络 概率密度函数
4
一种基于点集优化算法和变分量化自编码器的区域划分策略的三维重建方法
三维重建方法 编码器 三维重建模型 算法 棋盘格图像
5
一种基于扩散模型的零样本文本驱动视频编辑方法
视频编辑方法 文本 视频帧 Softmax函数 视频编辑技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号