摘要
本发明提供一种基于LDA模型和LSTM算法的公共文本分析方法及系统。该方法包括:获取科技项目的目标文本数据;提取目标文本数据中的特征词,依据特征词构建特征词向量矩阵;基于特征词向量矩阵,构建困惑度曲线,并基于困惑度曲线构建主题模型;基于主题模型,确定目标主题的主题关注度,并基于主题关注度确定关注度趋势特征,关注度趋势特征用于指示所述目标主题在时间维度、空间维度以及主题维度上的变化趋势;利用预先建立的情感分析模型对目标文本数据进行分析,得到情感分析结果;基于目标主题、关注度趋势特征和情感分析结果,生成科技项目的文本分析结果。本申请实现了公共文本的智能化分析,提高了文本解读的效率和准确性。
技术关键词
主题分布特征
主题模型
空间分布特征
情感分析模型
LDA模型
文本分析方法
数据分布
区域分布特征
LSTM模型
词语
密度
时间段
异常数据
曲线
地区特征
训练集
系统为您推荐了相关专利信息
文本
风格识别方法
主题关键词
LDA主题模型
计算机可读指令
词袋模型
指标
企业创新能力
大数据
机器学习算法
预报方法
随机森林模型
地面气象观测数据
卫星遥感数据
因子
数字孪生建模方法
点云
样本
训练集
数字孪生模型