摘要
本发明涉及自然语言处理的技术领域,提出一种基于大语言模型的机器翻译方法,包括以下步骤:获取包含若干条翻译示例的双语数据集,其中,每条翻译示例都包括一条源语句和所述源语句对应的翻译语句;获取待翻译语句;利用大语言模型将待翻译语句和所述翻译示例中的源语句分别转化为嵌入向量;计算所述待翻译语句对应的嵌入向量与源语句对应的嵌入向量之间的相关性得分;选取数值最大的前若干个相关性得分或数值大于预设阈值的相关性得分的源语句及其翻译语句作为翻译范例;将所述翻译范例输入所述大语言模型,使所述大语言模型仿照所述翻译范例对所述待翻译语句进行翻译,所述翻译范例与待翻译句子信息高度重合,从而使翻译结果的翻译效果优良。
技术关键词
大语言模型
语句
机器翻译方法
排序模型
计算机可读指令
机器翻译系统
表达式
数值
数据
标记
系列
模块
自然语言
处理器
计算机设备
符号
网络
文本
存储器
线性