摘要
本申请公开了一种无监督汉词语消歧方法、装置、终端设备及存储介质。本申请对用户输入的文本数据进行文本分割,获取若干词语,并依次提取各所述词语的多层特征;多层特征包括:第一语义层特征;对各所述词语的所述第一语义层特征进行迭代更新,每次更新时,根据各词语的多层特征,更新预设的语义图谱,以更新各词语对应节点的第一融合特征;并将第一融合特征输入至预训练完毕的消歧模型中,获取对应词语的第二语义层特征,以更新对应节点的第一语义层特征;直至各词语对应前后获取的第二语义层特征之间的第一余弦相似度小于预设值,根据当前获取的第二语义层特征,确定对应词语的语义表示。通过本申请,可以提高语义图谱以及消歧结果的准确性。
技术关键词
词语消歧方法
语义图谱
融合特征
节点
无监督
向量空间模型
样本
文本
特征提取模块
多层特征融合
情感分析技术
可读存储介质
终端设备
标注工具
计算机
处理器
数据
系统为您推荐了相关专利信息
抽象语法树
分析方法
节点
非暂态计算机可读存储介质
处理器
环境感知数据
空调器控制方法
网络节点
有向无环图
空调设备
风速预测方法
历史风速数据
时间卷积网络
GCN模型
数据采集模块