摘要
本发明实施例提供了一种热词识别方法及装置、电子设备、存储介质,方法包括:获取第一训练集和第二训练集,第一训练集为热词标注和热点事件类型标注的第一训练样本,第二训练集为热点事件类型标注的第二训练样本;按照第一训练集进行模型训练得到热词识别模型和第一热点事件分类模型,以及按照第二训练集进行模型训练得到第二热点事件分类模型;基于热词识别模型、第一热点事件分类模型以及第二热点事件分类模型,确定第二训练集的新增热词标注;基于新增热词标注更新热词识别模型和第一热点事件分类模型;采用更新后的热词识别模型和第一热点事件分类模型对获取的待分类事件进行热词提取。从而实现了减少热词标注的工作量,提高挖掘准确性。
技术关键词
热词识别方法
热点
训练集
置信度阈值
列表
上存储计算机程序
模型训练模块
电子设备
词语
可读存储介质
处理器
模型更新
样本
数据
存储器
工作量
参数