面向多词表达的机器翻译差分测试方法

正文

推荐专利

面向多词表达的机器翻译差分测试方法

申请号：CN202510961564

申请日期：2025-07-11

公开号：CN120874859A

公开日期：2025-10-31

类型：发明专利

摘要

针对主流机器翻译系统中多词表达语义翻译不精确的问题，本发明提出了一种面向多词表达的机器翻译差分测试方法。步骤如下：采用基于深度学习的分词工具划分为词汇单元，结合预训练序列标记模型分配句法标签，并利用依存分析工具spaCy对词之间的句法关系进行标注；将完成标注语料转换为标准CoNLL格式，通过自动化工具提取句子的多词表达式，建立句子级和短语级对应关系的测试数据集；将测试集输入多翻译系统生成译文，使用对齐工具AWESOME精准定位源语言与目标语言MWEs的对应关系；基于BERTScore计算翻译相似度，通过组内与组间双重校验机制，结合动态阈值识别误译、漏译和未译，完成机器翻译在多词表达上翻译准确性的评估。本发明提出的方法能够精准识别多词表达翻译错误，通过差分测试方法精细化评估机器翻译系统在短语级语义翻译的准确性。

技术关键词

测试方法对齐工具构建测试数据机器翻译系统依存句法分析自动化工具层级目标语言句子错误检测格式序列标注模型标记表达式翻译器标签语义开源工具分词

系统为您推荐了相关专利信息

硅胶按键导电性强化学习测试系统及方法

硅胶按键参数优化模型测试方法强化学习模型强化学习算法

一种基于图神经网络的关系抽取方法及系统

关系抽取方法句法依存关系三元组节点神经网络模型

芯片测试板、芯片验证系统、芯片测试系统以及芯片测试方法

FPGA芯片待测芯片芯片测试板芯片验证系统测试主机

一种用于自动驾驶车辆数据记录系统的测试方法和装置

车辆数据记录系统测试管理平台测试方法输入命令测试场景

一种电池测试方法、装置、电子设备及存储介质

初始荷电状态电池充电管理电池测试方法放电功能通用输入输出接口

面向多词表达的机器翻译差分测试方法

站点导航

APP 下载