摘要
本发明提供一种基于掩码自动编码器与噪声增强的模型预训练方法,涉及自然语言处理技术领域,该方法包括构建非对称编码‑解码模型,通过差异化的掩码比例和解码机制提升训练信号多样性。接着,引入噪声注入机制,通过向嵌入添加噪声增强模型对抗扰动的鲁棒性,并提出两项改进:一是动态调整噪声幅度,在训练初期使用较大噪声增强鲁棒性,后期减小噪声提升精度;二是在训练后期利用KL散度引导噪声生成,衡量原始嵌入与加噪嵌入的分布差异,使噪声针对模型弱点更智能化。在多个数据集上进行预训练与评估,显著提升零样本和监督学习场景下的密集检索性能。最终,该方法无需额外微调模型,即可提高检索任务中句子表示的准确性和稳定性。
技术关键词
预训练方法
自动编码器
解码模型
解码器
动态噪声
计算机软件产品
掩码策略
模型预训练
优化噪声
深度神经网络
计算机存储介质
鲁棒性
总线系统
语义
执行存储器存储
预训练语言模型
解码机制
系统为您推荐了相关专利信息
图像缺陷分割方法
多尺度图像块特征
前景文本
图像分割模型
辅助分类器
状态空间模型
图像生成方法
联合损失函数
网络
补丁
自动驾驶决策方法
智能体交互
交互机制
解码器
车辆行驶轨迹
融合神经网络
推荐模型构建方法
广告推荐方法
特征提取模块
编码器
深度特征提取网络
表面缺陷检测方法
分支
带钢表面缺陷
注意力