摘要
本发明公开了一种主题关键词字典的构建方法、装置、设备及存储介质。所述方法包括:获取训练语料文本;基于待训练的主题‑关键词字典对所述训练语料文本进行潜在狄利克雷分配LDA聚类,得到聚类结果,所述聚类结果至少包括所述训练语料文本中每个句子对应的主题;基于所述训练语料文本中主题为已知主题的句子,对待训练的主题‑关键词字典进行更新,得到更新后的主题‑关键词字典。该方法通过构建主题‑关键词字典,能够通过主题‑关键词字典挖掘出语料中的信息。
技术关键词
字典
主题关键词
文本
聚类
多元组
可读存储介质
矩阵
计算机
语义
处理器通信
存储器
样本
电子设备
模块
分词
指令
数据
系统为您推荐了相关专利信息
信用预测模型
通讯数据加密方法
矩阵
数据加密系统
奇异值分解法
原始图像数据
匹配误差
视觉模组
图像压缩算法
聚类
高维特征向量
热力图
烘干系统
红外热成像传感器
融合多模态特征
动态配置管理方法
SHA256算法
JSON字符串
客户端
对象