回归式大模型训练方法及装置

正文

推荐专利

回归式大模型训练方法及装置

申请号：CN202411443778

申请日期：2024-10-16

公开号：CN119670874A

公开日期：2025-03-21

类型：发明专利

摘要

本申请实施例提供一种回归式大模型训练方法及装置，涉及模型训练技术领域，所述方法包括：获取输入数据并将输入数据转为输入特征向量；将输入特征向量输入大模型进行预测，得到预测特征向量；结合预测特征向量跟实际特征向量进行回归损失计算，并根据计算结果对模型进行训练；使用回归任务的思想来训练大模型，去除了token的量化过程，可以避免token量化带来的损失，进而降低大模型的幻觉，节省GPU内存，同时应用场景广泛。

技术关键词

模型训练方法特征提取算法数据模型训练技术语音特征提取图像识别模型模型训练装置可读存储介质计算机文本存储器处理器电子设备模块指令服务器参数内存

系统为您推荐了相关专利信息

用户召回方法、装置、设备和存储介质

特征提取模型大语言模型数据召回方法画像

一种用于硫酸吸收塔的自动清理方法及系统

硫酸吸收塔自动清理方法图像熵值序列清理装置

面向智能量测终端APP应用的安全保护机制及实现方法

智能量测终端数字证书摘要哈希算法指令

一种矿用开停传感器定时控制系统及其控制方法

矿用开停传感器定时控制系统通信模块数据处理模块外部设备

一种葡萄干品质评价方法、设备以及存储介质

品质评价方法葡萄干多任务深度学习模型品质评价模型表面图像数据

回归式大模型训练方法及装置

站点导航

APP 下载