摘要
本发明提供一种基于文本数据的性格预测方法和社交画像生成方法,包括采集用户发表的贴文数据并清洗处理以生成贴文数据,获取用户所有贴文数据以生成用户数据;LDA模型识别用户数据以获取主题数据和与主题对应的关键词数据;MBTI模型基于关键词数据确定与MBTI四个维度之间的映射关系,以确定用户MBTI的四个维度特征,基于四个维度特征预测用户的性格特征。本发明能够依据用户发布文本所包含的主题和关键词预测其性格特征,再依据性格特征生成用户画像。
技术关键词
画像生成方法
性格预测方法
词语
生成用户画像
主题数据
社交
模型构建方法
LDA模型
关键词
文本
关系
因子
频率
分词
参数
格式