摘要
本发明涉及大数据分析技术领域,具体地说,涉及一种基于大数据的政务数据提取分析方法及系统。其包括以下步骤:定义需要覆盖的数据源类型和数据量级,进行自动化数据源识别,并记录每个数据源的基本信息;对数据源提供的数据进行分类,并为不同类型的数据源赋予不同的标签,且将不同标签下的数据分配不同的资源和处理优先级;从不同标签的数据源下抽取关键数据,并对关键数据进行预处理,将预处理后的数据合并到一个数据集中;对合并后的数据集进行数据分析。该方法不仅能够充分利用词典的精确性和机器学习的泛化能力,还能有效应对复杂多变的文本情感,显著提高了情感分析的准确性和鲁棒性。
技术关键词
分析方法
政务
文本
词语
词典
资源
大数据分析技术
情感分析模型
标签
BERT模型
实体
关系
分析系统
图像
处理器
小规模
存储器
鲁棒性
系统为您推荐了相关专利信息
新型冠状病毒
分析方法
蛋白质生物学功能
预测氨基酸突变
分析工具
锂电池容量预测方法
数据驱动方法
数字信号处理算法
信号分解技术
曲线分析方法
训练文本数据
病历
计算机程序指令
样本
数据存储