摘要
本发明公开了一种基于机器遗忘的伪相关缓解方法及系统,属于深度学习、自然语言处理技术领域。针对目前模型过度依赖数据与标签之间的伪相关,从而导致泛化能力不足,特别是在医学、金融等高风险场景下的应用受限问题,本发明创新的采取基于proximity的神经元定位方法,实现对神经元更精准的定位。神经元定位模块负责分析语言模型对因果和伪相关信息的存储机制,并定位因果或伪相关神经元。神经元编辑模块负责编辑定位到的神经元参数,以遗忘模型的伪相关先验,本方法在情感分析和自然语言推理任务上进行了验证,模型的泛化性分别超越了基线3.13%和2.04%。
技术关键词
注意力
标记
定位模块
标签
自然语言推理
粒子群优化算法
参数
编辑方法
归因
速度
机制
信息更新
定位方法
定义
高风险
人类
系统为您推荐了相关专利信息
区块生成方法
电子签章
量子随机数
节点
计算机程序指令
手语翻译方法
语言模块
视觉特征
手语翻译系统
解码器模型
辨识方法
SVM算法
模型预测值
XGBoost模型
预测评估模型