基于语言知识检索的大模型中缅机器翻译方法

AITNT
正文
推荐专利
基于语言知识检索的大模型中缅机器翻译方法
申请号:CN202510555098
申请日期:2025-04-29
公开号:CN120409500A
公开日期:2025-08-01
类型:发明专利
摘要
本发明涉及基于语言知识检索的大模型中缅机器翻译方法,属自然语言处理领域。包括:对中文到缅甸语平行语料构建树形检索结构的树根节点;将中文到缅甸语平行语料按照句子长度划分为长句对和短句对;通过短句对构建初步的树形检索结构;将长句对插入树形检索结构;检索阶段首先将待翻译文本经过LASER模型编码,后与树形检索结构中相关字词和句对进行匹配,通过BM25算法选出候选句对,并进一步计算候选句对与待翻译文本的余弦相似度;在使用大语言模型进行最终翻译前,使用文本重排序模型对检索得到的上下文提示句对进行重排序,将上下文提示句对与待翻译文本输入大语言模型得到最终翻译结果。本发明能提高翻译结果的准确性和流畅性。
技术关键词
机器翻译方法 文本 关系型数据库 字词 大语言模型 算法 树根 分词 平行语料数据 排序模型 矩阵 节点 长尾效应 词频统计 自然语言 阶段 定义 语义 噪声
系统为您推荐了相关专利信息
1
一种原油管道流动特性挖掘方法、系统、处理设备及存储介质
特性挖掘方法 原油 大语言模型 计算机程序指令 方程
2
基于图层蒙版的非结构化数据动态脱敏方法及装置
动态脱敏方法 字段 图像识别技术 非易失性计算机可读存储介质 坐标
3
一种基于多模态大型语言模型的诈骗网站检测方法及装置
网站检测方法 多模态 计算机可读取存储介质 样本 网站检测装置
4
操作辅助方法、装置、电子设备、存储介质及程序产品
队列 自然语言 图形交换格式 计算机程序产品 可读存储介质
5
基于数据增强的多模态实体连接方法
大语言模型 摘要 文本 语义 实体消歧
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号