摘要
本申请实施例公开了一种主题确定方法、装置及电子设备,涉及计算机技术领域。该方法包括:对待标引文本进行短语提取操作,得到候选短语;对候选短语进行向量化表示,确定候选短语对应的词向量;通过训练好的多层注意力特征提取模型,对待标引文本进行单词层面、语句层面和文本结构层面中的至少两个层面的注意力特征提取操作,得到待标引文本对应的语义向量;根据上述词向量和上述语义向量之间的相似度,从候选短语中确定出待标引文本对应的主题。采用本申请实施例,可以得到与待标引文本语义关联程度较高的主题,进一步提高所得到的主题之间的相关性,提高主题标引效果,满足实际需求。
技术关键词
语义向量
文本
多层注意力
特征提取模型
主题
语句
词性信息
电子设备
可读存储介质
存储计算机程序
处理器
存储器
同义词
模块
因子
系统为您推荐了相关专利信息
证件制作设备
设备管理服务器
证件制作系统
数据传输协议
模板