摘要
本发明公开了一种深度学习慕课帖子分类模型的解释方法,能够对模型的预测给出准确的解释,旨在解决深度学习模型因参数过多造成的“黑盒子”不透明问题。首先,对原始帖子进行随机单词删除,生成扰动样本集,然后通过最小二乘法去训练一个特征选择线性代理模型。其次,综合考虑LIME值和SHAP值,为扰动样本找出k个最重要的单词在原始慕课帖子中的位置,并以此为依据从扰动样本对应的词袋向量中选出新的元素,排列成新的词袋向量序列,然后使用其去训练一个特征量化线性代理模型,最后采用训练好的特征量化线性代理模型的权重对新的词袋向量序列进行计算,得到原始深度学习慕课帖子分类模型对原始慕课帖子的解释及其LIME值。
技术关键词
帖子
特征选择
样本
线性
元素
序列
文本
深度学习模型
正则化参数
矩阵求逆运算
解释技术
复杂度
论文
定义
度量
符号
标签
代表