摘要
本发明公开的一种基于句法信息增强的细粒度隐喻识别方法,属于自然语言处理和隐喻识别技术领域。本发明实现方法为:1、构建句法关系图,将句法关系图的词语节点通过递归拆分子串提取的语义特征向量和采用one‑hot编码提取的词性特征向量进行拼接,形成词语节点的特征向量;2、构建用于非结构化文本的细粒度隐喻识别模型;对句法、语义的选择偏好违反向量和隐喻识别向量进行特征融合,通过线性分类器获取二分类概率分布;3、对非结构化文本的细粒度隐喻识别模型进行训练;4、将非结构化文本输入至已训练的非结构化文本的细粒度隐喻识别模型中,获得隐喻词;与现有技术相比,本发明提升了非结构化文本隐喻的细粒度识别准确度。
技术关键词
句法信息
词语
识别方法
线性分类器
独立语义
节点
非结构化文本
矩阵
Softmax函数
编码
融合特征
序列
标签
自然语言
索引
标记
分词
总量