摘要
本发明涉及一种基于主题综合得分的股票筛选和预测方法及系统,所述方法包括以下步骤:获取文本并进行数据清洗,分词处理后得到文本中的词汇;对文本进行主题提取,得到每个主题下的词汇及其出现次数;计算词汇之间相似度,根据相似度对词汇进行主题归类,得到每个主题下相关词汇在文本中出现的总次数,将其作为主题的主题热度;预测文本的情感极性,并计算每一个主题的情感极性得分;根据主题热度和情感极性得分得到主题综合得分;选取主题综合得分排名靠前的主题,将主题下的相关股票加入股票池,在股票池中筛选得到股票标的;通过股票预测模型预测股票标的的涨跌,得到预测结果。与现有技术相比,本发明提高了量化择标和股票涨跌预测的准确率。
技术关键词
主题
LDA模型
随机森林模型
分词
Word2Vec模型
LSTM模型
中文文本
噪声数据
策略
预测股票
数据存储
模块
预测系统
算法
变量
训练集
代表
广告