摘要
本发明公开一种基于商品问卷评论文本的词云生成方法及装置,该方法通过BERT模型及人工规则构建评论有效性评分模型,对原始评论文本进行清洗,删除无效字符并预测补充标点,生成规范化文本;将文本分割为短句后去除停用词,提取未匹配预设词库的待收集分词,筛选包含主题词与评价词的分词存入优点/建议评论集;基于简化文本规则提取评价分词列表,通过相似分词分组字典转换为代表性关键分词;结合文本相似度与词向量余弦相似度聚类分组,人工修正后生成相似分词字典;累加同组词频并分类统计,生成优点词云与建议词云。本发明解决了传统词云语义割裂、同义词分散的问题,为商品优化与用户需求分析提供高精度可视化支持。
技术关键词
分词
生成方法
有效性
生成评论文本
BERT模型
生成装置
字典
字符
列表
匹配模块
算法
新词
同义词
对象
语义
系统为您推荐了相关专利信息
构建人源化
无菌小鼠
小鼠模型
抑郁
动物模型构建
动画生成方法
高分辨率纹理
动画生成系统
贴图
识别面部
信息生成方法
文本分析模型
智能手表
语音
面部特征
模糊测试脚本
工控协议
生成方法
协议会话
大语言模型