摘要
本发明提供一种基于领域知识的主题化标引方法、装置和设备,方法包括在数据源中收集领域知识;通过自然语言处理对所述领域知识进行降噪处理,得到降噪后领域知识;基于深度学习和自然语言处理提取所述降噪后领域知识的主题特征,基于所述主题特征构建词向量主题模型;基于无监督学习,利用领域知识样本对所述词向量主题模型进行训练,得到领域知识识别模型;输入待确定领域知识至所述领域知识识别模型,确定所述待确定领域知识与目标领域知识的相似度;基于所述相似度确定所述待确定领域知识的主题标引结果,可以比较准确的标引领域知识的主题。
技术关键词
标引方法
主题模型
主题特征
自然语言
无监督学习
命名实体识别
模型训练模块
矩阵
数据获取模块
处理器
样本
变换器
存储器
编码器
电子设备
分词
标签
程序
系统为您推荐了相关专利信息
智能对话方法
智能对话系统
玩家
手机APP客户端
数据管理
主动悬架控制方法
驾驶风格识别
油门踏板开度
工况
分类识别模型
大语言模型
问答方法
兴趣点
核密度估计方法
空间聚类算法
精准匹配方法
团队
关键词匹配方法
画像模型
深度匹配网络
混沌神经网络
语义分析方法
自然语言文本
隐马尔可夫模型
语义特征