摘要
本发明公开了一种文档复合标签的生成方法、装置、设备以及存储介质,所述方法包括:生成目标文档主题对应的主题标签相似度矩阵;生成对应的用户标签相似度矩阵;生成对应的用户协同相似矩阵和主题协同相似矩阵;将用户协同相似矩阵和主题协同相似矩阵输入至一预设的复合标签抽取TagDC模型,以使得复合标签抽取TagDC模型根据用户协同相似矩阵和主题协同相似矩阵,生成每个目标文档的多标签置信概率列表,输出每个目标文档的多标签置信概率列表;根据多标签置信概率列表,从多标签置信概率列表中选取若干标签组合生成目标文档的复合标签。通过本发明可以生成目标文档的复合标签,提高电力文档标签的覆盖度和准确性。
技术关键词
复合标签
多标签
标签知识库
主题数据库
列表
生成方法
矩阵
关键词
生成装置
模块
新词
文本
处理器
存储器
算法
电子设备
计算机
电力
系统为您推荐了相关专利信息
自然语言
指标
数据分析方法
意图识别
意图分类识别
动态场景
场景检索方法
道路拓扑信息
道路标识信息
元素
激光切割方法
锂电池
样本
无监督聚类
DBSCAN聚类算法