摘要
本发明涉及基于信息筛选网络的汉越跨语言依存句法分析方法,属于自然语言处理领域。首先,本发明利用跨语言预训练模型XLM‑RoBERTa提取中文和越南语句子的词嵌入表示;接着分别对两种语言使用独立私有的BiLSTM进行编码;然后将源语言的BiLSTM和目标语言的BiLSTM的特征信息输入到信息筛选网络,该网络通过动态地学习不同语言特定表示之间的匹配权重;其次利用MLPs降低特征的维度来获取每个词的句法关系表示和词性标签表示;最后使用双仿射解码器解码,同时寻找最优的依存语法树。该发明通过动态学习不同语言的匹配权重信息,从而实现对源语言信息的有效筛选和利用,并在实验中取得了显著的效果。
技术关键词
依存句法分析方法
上下文语义信息
预训练模型
长短时间记忆网络
知识迁移学习
非暂态计算机可读存储介质
中文特征
解码器
处理器
动态地
多层感知机
计算机程序产品
带标签
自然语言
编码
元素
存储器
系统为您推荐了相关专利信息
考试试题生成方法
文本
特征融合网络
特征提取网络
数据
预训练模型
自然语言生成技术
多模态数据采集
数据传输延迟
多头注意力机制
知识图谱构建方法
网络安全信息
网络安全实体
attention机制
网络安全交叉技术
康复训练系统
康复训练装置
预训练模型
电极片
降噪耳机