摘要
本申请涉及一种大语言模型的任务感知解码方法、装置、设备及存储介质,其中,方法包括:确定初始大语言模型的输出标签的第一条件概率分布,并基于预设算法对初始大语言模型进行调整,并确定调整后的初始大语言模型的输出标签的第二条件概率分布;根据第一条件概率分布和第二条件概率分布确定微调空间向量,并调整微调空间向量得到知识向量,并利用预设的激活函数将知识向量转化为微调概率分布;利用预设的合并公式合并微调概率分布和第二条件概率分布得到目标概率分布,并根据目标概率分布指导微调后的大语言模型的输出结果。由此,解决了相关技术对高质量数据依赖性过高,模型适用性较差的问题,增强大语言模型在下游任务中的适应性和表现。
技术关键词
大语言模型
解码方法
标签
解码装置
处理器
解码模块
算法
可读存储介质
存储器
电子设备
程序
计算机
数据
系统为您推荐了相关专利信息
语义数据库
物体位置数据
定位系统
多模态
双目摄像头
调度优化模型
船闸
船舶调度优化方法
群粒子群优化
学习方法
条件生成对抗网络
解码器
生成人脸图像
训练样本数据
编辑方法