一种基于掩码自动编码器与噪声增强的模型预训练方法

AITNT
正文
推荐专利
一种基于掩码自动编码器与噪声增强的模型预训练方法
申请号:CN202510423102
申请日期:2025-04-07
公开号:CN119940470B
公开日期:2025-08-26
类型:发明专利
摘要
本发明提供一种基于掩码自动编码器与噪声增强的模型预训练方法,涉及自然语言处理技术领域,该方法包括构建非对称编码‑解码模型,通过差异化的掩码比例和解码机制提升训练信号多样性。接着,引入噪声注入机制,通过向嵌入添加噪声增强模型对抗扰动的鲁棒性,并提出两项改进:一是动态调整噪声幅度,在训练初期使用较大噪声增强鲁棒性,后期减小噪声提升精度;二是在训练后期利用KL散度引导噪声生成,衡量原始嵌入与加噪嵌入的分布差异,使噪声针对模型弱点更智能化。在多个数据集上进行预训练与评估,显著提升零样本和监督学习场景下的密集检索性能。最终,该方法无需额外微调模型,即可提高检索任务中句子表示的准确性和稳定性。
技术关键词
预训练方法 自动编码器 解码模型 解码器 动态噪声 计算机软件产品 掩码策略 模型预训练 优化噪声 深度神经网络 计算机存储介质 鲁棒性 总线系统 语义 执行存储器存储 预训练语言模型 解码机制
系统为您推荐了相关专利信息
1
一种基于文本引导的弱监督图像缺陷分割方法及系统
图像缺陷分割方法 多尺度图像块特征 前景文本 图像分割模型 辅助分类器
2
一种基于Mamba网络和对抗蒸馏的图像生成方法
状态空间模型 图像生成方法 联合损失函数 网络 补丁
3
基于智能体交互主动感知遮挡的自动驾驶决策方法及装置
自动驾驶决策方法 智能体交互 交互机制 解码器 车辆行驶轨迹
4
基于融合神经网络的用户广告推荐方法、设备及其模型构建方法
融合神经网络 推荐模型构建方法 广告推荐方法 特征提取模块 编码器
5
一种基于深度学习的钢铁表面缺陷检测方法
深度特征提取网络 表面缺陷检测方法 分支 带钢表面缺陷 注意力
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号