一种基于掩码自动编码器与噪声增强的模型预训练方法

正文

推荐专利

申请号：CN202510423102

申请日期：2025-04-07

公开号：CN119940470B

公开日期：2025-08-26

类型：发明专利

摘要

本发明提供一种基于掩码自动编码器与噪声增强的模型预训练方法，涉及自然语言处理技术领域，该方法包括构建非对称编码‑解码模型，通过差异化的掩码比例和解码机制提升训练信号多样性。接着，引入噪声注入机制，通过向嵌入添加噪声增强模型对抗扰动的鲁棒性，并提出两项改进：一是动态调整噪声幅度，在训练初期使用较大噪声增强鲁棒性，后期减小噪声提升精度；二是在训练后期利用KL散度引导噪声生成，衡量原始嵌入与加噪嵌入的分布差异，使噪声针对模型弱点更智能化。在多个数据集上进行预训练与评估，显著提升零样本和监督学习场景下的密集检索性能。最终，该方法无需额外微调模型，即可提高检索任务中句子表示的准确性和稳定性。

技术关键词

预训练方法自动编码器解码模型解码器动态噪声计算机软件产品掩码策略模型预训练优化噪声深度神经网络计算机存储介质鲁棒性总线系统语义执行存储器存储预训练语言模型解码机制

系统为您推荐了相关专利信息

一种基于文本引导的弱监督图像缺陷分割方法及系统

图像缺陷分割方法多尺度图像块特征前景文本图像分割模型辅助分类器

一种基于Mamba网络和对抗蒸馏的图像生成方法

状态空间模型图像生成方法联合损失函数网络补丁

基于智能体交互主动感知遮挡的自动驾驶决策方法及装置

自动驾驶决策方法智能体交互交互机制解码器车辆行驶轨迹

基于融合神经网络的用户广告推荐方法、设备及其模型构建方法

融合神经网络推荐模型构建方法广告推荐方法特征提取模块编码器

一种基于深度学习的钢铁表面缺陷检测方法

深度特征提取网络表面缺陷检测方法分支带钢表面缺陷注意力

一种基于掩码自动编码器与噪声增强的模型预训练方法

站点导航

APP 下载