摘要
本发明提供基于词粒度对齐的大模型上下文学习机器翻译方法,涉及自然语言处理领域,本发明包括:外部知识辅助阶段,对源文本词汇对齐集合进行多层次检索匹配;大模型翻译阶段,得到大模型翻译集合,将大模型翻译集合作为候选翻译之一;后选择阶段,将获取的源文本词对齐集合和外部字典词对齐集合、实体库对齐集合、辅助翻译集合的嵌入表征、大模型翻译集合分别进行多次的相似度计算打分,根据相似度得分进行筛选以得到候选词对齐集合;根据任务设计提示模板,将源文本词对齐集合和候选词对齐集合放到提示模板中,通过高度对齐的外部词对齐集合供大模型上下文学习生成最佳翻译结果;本发明在缓解了大模型在低资源环境下各种翻译错误。
技术关键词
机器翻译方法
语法结构
机器翻译模型
文本
双语对齐语料
实体
字典
模板
在线学习机制
子模块
多层次
词向量表征
阶段
动态更新
语义
无监督
检索策略
结构封装
编码器
系统为您推荐了相关专利信息
知识图谱驱动
实体标识符
水利
实体消歧
自然语言