摘要
本发明特别涉及一种基于数据采集的舆情分析方法与系统。该基于数据采集的舆情分析方法,实时采集互联网上的各类舆情信息,数据预处理,将其转化为结构化的文本数据;对文本进行分词处理和词性标注,利用自然语言处理技术进行情感分析,对实体进行地点与人物特征进行提取与分类;基于文章分类与文章内容相似度进行相似事件聚合,利用相近度与图中心论思想提高摘要提取效果;对经过情感分析的舆情信息进行深入分析,形成舆情分析报告。该基于数据采集的舆情分析方法与系统,实现了对海量舆情数据的智能分析,提高了舆情监测和预警的效率,能够为用户提供实时的舆情信息服务,具有较高的实用性和市场价值。
技术关键词
舆情分析方法
人物实体
情感分析模型
双向注意力机制
BERT模型
命名实体识别
文本
机器学习分类器
条件随机场
自然语言
人物特征
光学字符识别
分词
地点
报告
批量数据
标签
摘要
系统为您推荐了相关专利信息
医疗文本分类方法
学习器
文本分类模型
异构
BiLSTM模型
轨道交通线网
数据挖掘方法
时空图卷积神经网络
移动轨迹数据
门控循环单元