摘要
本申请公开了一种考题相似度计算方法、介质及设备,包括:在考题数据库中选取不同类型的考题,并对选取的考题进行预处理,以构建训练数据库;通过通用文本对深度学习模型进行预训练,以优化深度学习模型的语言分析能力;通过训练数据库对预训练后的深度学习模型进行二次训练,以优化预训练后的深度学习模型的标签标注能力;以考题数据库中的考题作为二次训练后的深度学习模型的输入,得到考题数据库中各考题对应的向量编码,向量编码包含各考题的标签标注信息;基于向量编码计算考题数据库中各考题之间的相似度。通过上述方式,本申请能够准确高效地进行考题之间的相似度判别。
技术关键词
深度学习模型
度计算方法
标签
语言分析
编码
数据
处理器
计算机设备
文本
格式
存储器
试卷
介质
程序
参数
噪声