回归式大模型训练方法及装置

AITNT
正文
推荐专利
回归式大模型训练方法及装置
申请号:CN202411443778
申请日期:2024-10-16
公开号:CN119670874A
公开日期:2025-03-21
类型:发明专利
摘要
本申请实施例提供一种回归式大模型训练方法及装置,涉及模型训练技术领域,所述方法包括:获取输入数据并将输入数据转为输入特征向量;将输入特征向量输入大模型进行预测,得到预测特征向量;结合预测特征向量跟实际特征向量进行回归损失计算,并根据计算结果对模型进行训练;使用回归任务的思想来训练大模型,去除了token的量化过程,可以避免token量化带来的损失,进而降低大模型的幻觉,节省GPU内存,同时应用场景广泛。
技术关键词
模型训练方法 特征提取算法 数据 模型训练技术 语音特征提取 图像识别模型 模型训练装置 可读存储介质 计算机 文本 存储器 处理器 电子设备 模块 指令 服务器 参数 内存
系统为您推荐了相关专利信息
1
用户召回方法、装置、设备和存储介质
特征提取模型 大语言模型 数据 召回方法 画像
2
一种用于硫酸吸收塔的自动清理方法及系统
硫酸吸收塔 自动清理方法 图像熵值 序列 清理装置
3
面向智能量测终端APP应用的安全保护机制及实现方法
智能量测终端 数字证书 摘要 哈希算法 指令
4
一种矿用开停传感器定时控制系统及其控制方法
矿用开停传感器 定时控制系统 通信模块 数据处理模块 外部设备
5
一种葡萄干品质评价方法、设备以及存储介质
品质评价方法 葡萄干 多任务深度学习模型 品质评价模型 表面图像数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号