摘要
本申请公开了一种基于多粒度知识增强的文档级机器翻译方法及相关装置,涉及文档级机器翻译技术领域,该方法包括:对使用源语言的待翻译源文档进行分割,得到多个子文档,利用大语言模型生成多粒度知识,包括全局源语言摘要、全局目标语言摘要、全局专有名词集合和全局主题描述这些全局知识以及每一个子文档的核心话题和过渡提示这些局部知识,在多粒度知识增强下,利用大语言模型对每一个子文档进行翻译,并对子文档和翻译后子文档进行句子对齐,若句子对齐成功,则利用大语言模型去除每一个翻译后子文档中的重叠句子后再进行拼接,即可得到使用目标语言的翻译后目标文档。本申请可提高翻译质量。
技术关键词
机器翻译方法
大语言模型
摘要
主题
话题
机器翻译技术
核心
处理器
计算机程序产品
语义
计算机设备
可读存储介质
存储器
系统为您推荐了相关专利信息
数据标签
自动生成方法
卷积神经网络提取
特征信息融合
自动生成系统