摘要
本发明公开一种基于事件回顾的新闻事件发现方法,本方法通过提出的文章编码模型来获取能更好表示新闻文章事件内容的嵌入表示,再结合事件回顾以及无关句子遮蔽的方法,对可能存在误判的新闻文章重新进行分析,根据分析结果重新分配到对应的簇或者生成新的事件簇中,从而将部分被误判的新闻聚类到正确的簇中,更新事件聚类空间。本发明解决了新闻检索系统在对新闻事件进行发现聚类的过程中聚类后的事件无法随着时间得到更新的问题,通过对历史新闻数据不断进行回顾并且纠错,使其聚类到更准确的事件簇中,提高了新闻检索系统中新闻事件发现的性能。
技术关键词
文章
事件发现方法
聚类
注意力
LSTM神经网络
检索系统
预训练语言模型
处理器
编码
文本
度函数
高层次
程序
存储器
参数
样本
元素
纠错
语义
种子
系统为您推荐了相关专利信息
工业故障检测方法
分层
注意力
多样性准则
知识蒸馏技术
疲劳寿命评估
主梁
贝叶斯神经网络
样本
工程结构健康监测技术
动态优化方法
K均值聚类算法
工况
指标
遗传算法