摘要
本发明实施例提供了一种模型的训练方法、装置、电子设备及存储介质,涉及深度学习技术领域,所述方法包括:对主题文档进行分词,获得分词列表;获取针对分词列表的滑动窗口,并根据滑动窗口对分词列表进行词频统计,获得分词列表对应的全局词频表;对全局词频表进行特征统计,获得对应的稀疏特征;根据全局词频表对稀疏特征进行特征融合,获得稠密矩阵;获取与主题文档对应的领域词典,并根据领域词典对稠密矩阵进行加权处理,获得对应的混合特征矩阵;根据混合特征矩阵对待训练的初始分类器进行训练,获得训练后的目标分类器,有效地降低了对人工标注的依赖性,形成了端到端的冷启动解决方案,降低了模型训练过程中的噪声干扰,缩短训练周期。
技术关键词
混合特征矩阵
稀疏特征
分词
滑动窗口
分类器
列表
词频统计
词典
主题特征
关键词
协方差矩阵
特征值
词向量模型
贡献率
通信接口
深度学习技术
电子设备
超参数