摘要
本发明属于大数据分析领域,提供了一种科技创新大数据分析挖掘方法,包括:待分析内容收集、科技创新内容判断、文本拆分、内容预处理、结构化数据和非结构化数据识别、非结构化权重集提取、结构化权重集提取、输入数据构建、数据挖掘以及键值对输出整合。本发明通过进行科技创新内容判断从数据收集阶段过滤了非研究方向内容,提高了用于数据挖掘的内容质量;通过对结构化数据和非结构化数据进行权重添加,提取了内容的核心部分,降低了数据挖掘量,提高了数据挖掘的效率;通过对结构化数据和非结构化数据加权和组合,实现了结构化数据和非结构化数据的同步挖掘。
技术关键词
大数据分析挖掘
科技创新
分词
关键字
词频统计
文本
频率
网址
键值
噪声数据
参数
遗传算法
爬虫
核心
阶段
系统为您推荐了相关专利信息
大语言模型
数据采集单元
报告
数据分析模块
处理单元
集成方法
word2vec模型
词嵌入模型
文本
注意力机制