摘要
本申请涉及大模型预训练技术领域,具体提供一种针对目标场景的大模型预训练方法、装置、设备及介质,旨在解决大模型预训练方法无法较好地满足特定场景需求的技术问题。为此目的,本申请获取通用训练数据以及目标场景训练数据,基于通用训练数据对大模型进行监督训练,学习通用特征;基于目标场景训练数据对监督训练后的大模型进行自监督训练,提高模型在目标场景下的偏向性;基于目标场景训练数据对自监督训练后的大模型进行弱监督训练,进一步提高大模型在目标场景下的语义能力。本申请解决了现有大模型预训练方法无法较好地满足特定场景需求的问题,通过结合多种训练方法,充分利用了不同方法的优势,达到了相互补充、相互促进的作用。
技术关键词
预训练方法
场景
多标签图像
文本
图像解码器
模型预训练
图像编码器
通用特征
数据获取模块
处理器通信
智能设备
可读存储介质
存储器
语义
系统为您推荐了相关专利信息
声纹特征
特征提取模型
克隆方法
音频放大器
意图
内容生成方法
注意力
样本
机器可读存储介质
文本特征向量
智能合约代码
重构方法
大语言模型
生成智能合约
工作流