针对目标场景的大模型预训练方法、装置、设备及介质

正文

推荐专利

申请号：CN202410948731

申请日期：2024-07-15

公开号：CN118840643A

公开日期：2024-10-25

类型：发明专利

摘要

本申请涉及大模型预训练技术领域，具体提供一种针对目标场景的大模型预训练方法、装置、设备及介质，旨在解决大模型预训练方法无法较好地满足特定场景需求的技术问题。为此目的，本申请获取通用训练数据以及目标场景训练数据，基于通用训练数据对大模型进行监督训练，学习通用特征；基于目标场景训练数据对监督训练后的大模型进行自监督训练，提高模型在目标场景下的偏向性；基于目标场景训练数据对自监督训练后的大模型进行弱监督训练，进一步提高大模型在目标场景下的语义能力。本申请解决了现有大模型预训练方法无法较好地满足特定场景需求的问题，通过结合多种训练方法，充分利用了不同方法的优势，达到了相互补充、相互促进的作用。

技术关键词

预训练方法场景多标签图像文本图像解码器模型预训练图像编码器通用特征数据获取模块处理器通信智能设备可读存储介质存储器语义

系统为您推荐了相关专利信息

实时交互的语音克隆方法、装置、设备和介质

声纹特征特征提取模型克隆方法音频放大器意图

内容生成方法、装置、电子设备、存储介质及程序产品

内容生成方法注意力样本机器可读存储介质文本特征向量

资源池容量预测方法、装置和电子设备

容量预测模型容量预测方法时间段序列资源

一种基于大语言模型反馈的语言学习评估方法及系统

大语言模型编码子模块文本日志

一种智能合约代码重构方法、装置、设备及可读存储介质

智能合约代码重构方法大语言模型生成智能合约工作流

针对目标场景的大模型预训练方法、装置、设备及介质

站点导航

APP 下载