摘要
本公开提供的关键词抽取方法、装置、电子设备、存储介质和程序产品,涉及自然语言处理技术领域。该方法包括:对文本进行依存句法分析,得到文本中具有句法依存关系的词语以及词语之间的直接依存关系,并为直接依存关系映射直接依存关系权重,直接依存关系权重表示具有直接依存关系的词语的重要程度;确定具有间接依存关系的词语,并基于具有间接依存关系的词语之间所包括的直接依存关系权重确定间接依存关系权重;基于间接依存关系权重,确定文本中具有句法依存关系词语的重要性分数;抽取重要性分数大于预设值的词语,将抽取到的词语作为关键词。通过本公开提升了关键词的召回质量,解决了相关技术在语音转录场景中的精准性不足的问题。
技术关键词
关键词抽取方法
句法依存关系
词语
依存句法分析
文本
电子设备
滑动窗口
分块
抽取装置
计算机程序产品
分词
自然语言
处理器
指令
语义
可读存储介质
语音
存储器