摘要
本申请公开了基于大语言模型的任务处理方法、装置、设备及介质,涉及数据处理技术、人工智能技术、大模型技术、大语言模型技术领域,该方法包括:基于目标大语言模型对目标任务的任务数据进行处理,得到目标任务的处理结果;目标大语言模型是基于初始大语言模型对应的生成损失和重建模型对应的重建损失,对初始大语言模型的参数进行调整后得到的;重建模型的输入被配置为第一数据样本和初始大语言模型针对第一数据样本所得到的向量表示中位于结束标记处的第一向量表示;重建模型的输出被配置为第一数据样本的重建结果。本公开能够在保证大语言模型对于生成任务的处理能力的同时,解决大语言模型对于表征任务的处理能力较差的问题。
技术关键词
大语言模型
样本
注意力
参数
标记
可读存储介质
人工智能技术
数据处理技术
指令
数据获取模块
数据处理模块
计算机程序产品
存储器
处理器
矩阵
电子设备
系统为您推荐了相关专利信息
射频天线阵列
射频接收
局部放电图谱
局部放电检测
接收信噪比
肠道微生态
数学计算模型
运动能力评估
数据接口模块
高通量测序技术
气动弹性分析方法
载荷
非线性动力学模型
气动力
风速
无人机
定位方法
实景三维模型
双向特征金字塔
坐标系
仿真模型
效能
实时数据
仿真系统
服务器集群环境