摘要
本申请提供了一种基于大数据的机器翻译系统及文档级词汇翻译方法,通过提取出目标文档中词汇在翻译过程中的全局注意力;对词汇进行语义角色分析,得到词汇的语义角色特征,根据语义角色特征和词汇间的语义相似度构建词汇的词链;确定词链中各个同源单词对目标文档主题的语义贡献度,进一步对词链中的各个同源单词进行注意力交互,得到词链中各个同源单词的语义注意力;通过词链中各个同源单词的语义注意力和各个同源单词之间的词链语义关系对各个同源单词之间的上下文信息进行交互语义嵌入,得到各个同源单词的语义嵌入量,进而基于所有的语义嵌入量进行文档级词汇翻译。采用本申请的方案,可实现消解文档中词汇上下文跨句翻译产生的语义漂移。
技术关键词
语义角色
语义注意力
机器翻译系统
主题关键词
注意力机制
翻译方法
技术性文档
大数据
主题模型
大语言模型
关系
语句
索引
模块
标签
频率
强度
系统为您推荐了相关专利信息
融合多尺度特征
点云
跨尺度特征融合
基准
语义注意力
档案信息管理系统
子模块
拓扑特征
文本
加密算法
指数
Softmax函数
文本生成方法
查找表
索引
焊缝缺陷检测方法
语义分割网络
焊缝缺陷图像
智能切割方法
矩形
车辆轨迹预测方法
历史轨迹数据
地图特征
图像块
交互特征