摘要
本申请实施例提供一种回归式大模型训练方法及装置,涉及模型训练技术领域,所述方法包括:获取输入数据并将输入数据转为输入特征向量;将输入特征向量输入大模型进行预测,得到预测特征向量;结合预测特征向量跟实际特征向量进行回归损失计算,并根据计算结果对模型进行训练;使用回归任务的思想来训练大模型,去除了token的量化过程,可以避免token量化带来的损失,进而降低大模型的幻觉,节省GPU内存,同时应用场景广泛。
技术关键词
模型训练方法
特征提取算法
数据
模型训练技术
语音特征提取
图像识别模型
模型训练装置
可读存储介质
计算机
文本
存储器
处理器
电子设备
模块
指令
服务器
参数
内存
系统为您推荐了相关专利信息
硫酸吸收塔
自动清理方法
图像熵值
序列
清理装置
矿用开停传感器
定时控制系统
通信模块
数据处理模块
外部设备
品质评价方法
葡萄干
多任务深度学习模型
品质评价模型
表面图像数据