摘要
本申请公开了一种基于NLP技术实现文本主题的智能提取方法及系统,属于NLP领域。该方法包括:接收输入的待提取文档,确定待提取文档的模态类型;确定目标NLP特征提取方法,使用此方法确定待提取文档对应的特征信息;将特征信息输入至预设的主题提取模型,确定至少两个备选主题;获取各备选主题的主题分布向量,计算各备选主题之间的相似度;确定达到预设的相似度阈值的备选主题的权重信息,计算目标主题的主题分布,对主题分布进行归一化以及主题映射,得到目标主题。本申请可以针对不同类型的文档采用适当的特征提取方法,从而保证了特征的全面性和准确性,通过计算备选主题的相似度并进行主题融合,可以得到更综合的主题。
技术关键词
主题
特征提取方法
智能提取方法
NLP技术
句法结构
分词
文本
词语
解密密钥
多媒体
智能提取系统
音频特征
语义
生成加密密钥
密钥生成算法
标签
模块
数据
系统为您推荐了相关专利信息
自动评估系统
主题关键词
语义关联度
语义向量
主题语义