摘要
本发明涉及基于语言知识检索的大模型中缅机器翻译方法,属自然语言处理领域。包括:对中文到缅甸语平行语料构建树形检索结构的树根节点;将中文到缅甸语平行语料按照句子长度划分为长句对和短句对;通过短句对构建初步的树形检索结构;将长句对插入树形检索结构;检索阶段首先将待翻译文本经过LASER模型编码,后与树形检索结构中相关字词和句对进行匹配,通过BM25算法选出候选句对,并进一步计算候选句对与待翻译文本的余弦相似度;在使用大语言模型进行最终翻译前,使用文本重排序模型对检索得到的上下文提示句对进行重排序,将上下文提示句对与待翻译文本输入大语言模型得到最终翻译结果。本发明能提高翻译结果的准确性和流畅性。
技术关键词
机器翻译方法
文本
关系型数据库
字词
大语言模型
算法
树根
分词
平行语料数据
排序模型
矩阵
节点
长尾效应
词频统计
自然语言
阶段
定义
语义
噪声
系统为您推荐了相关专利信息
特性挖掘方法
原油
大语言模型
计算机程序指令
方程
动态脱敏方法
字段
图像识别技术
非易失性计算机可读存储介质
坐标
网站检测方法
多模态
计算机可读取存储介质
样本
网站检测装置
队列
自然语言
图形交换格式
计算机程序产品
可读存储介质