摘要
本申请关于一种基于文档内容结构的主题词提取方法,涉及基于文档内容结构的主题词提取方法。该方法包括:获取目标文本片段,目标文本片段为待提取主题词的文本片段;将目标文本片段属于主题词提取模型,输出得到主题词提取结果,主题词提取结果实现为短语或词组形式,主题词提取模型为人工智能模型;基于主题词提取结果生成档案标签,档案标签与目标文本片段以及主题词提取结果关联。在对于文本片段进行内容提取的过程当中,选用主题词提取模型对于文本片段进行标注,并结合人工智能技术,生成与文本段落对应的档案标签,进而提高了对于文本内容进行提取以及标签生成的效率。
技术关键词
主题词提取方法
档案标签
字段
人工智能模型
输出模块
样本
文字识别技术
文本段落
人工智能技术
数据格式
计算机设备
列表
频率
关系
系统为您推荐了相关专利信息
脑部磁共振成像
加权特征
多模态
融合特征
分割方法
融合特征提取
多层级特征
数据分析单元
粒子
数据分析模块
网格
检测模型训练方法
角点检测方法
画布
角点检测装置