摘要
本发明公开了一种基于局部词嵌入技术的关键词相关主题分析方法,当用户输入关键词后,该方法将利用全局词嵌入技术在文本大数据中对关键词进行分析,根据数据中词汇与关键词的余弦相似度排序筛选出主题词,通过主题词构建主题词典,并对文本大数据库按时间、作者、文章类型等方式进行分段,在段内对关键词和主题词典进行局部词嵌入分析,并通过各分段中的局部余弦相似度得到各段主题,进而可以分析关键词在文本大数据库里的主题变化情况。本发明可广泛应用于社会科学、舆情监测、历史文献分析等领域,为文本挖掘提供了一种高效、精准的主题动态分析工具。
技术关键词
主题分析方法
词嵌入技术
关键词
大数据
文本
神经网络模型
分段
词典
文章
分词
处理器
计算机设备
可读存储介质
存储器
报纸
定义