基于词粒度对齐的大模型上下文学习机器翻译方法

正文

推荐专利

申请号：CN202510829731

申请日期：2025-06-20

公开号：CN120893450A

公开日期：2025-11-04

类型：发明专利

摘要

本发明提供基于词粒度对齐的大模型上下文学习机器翻译方法，涉及自然语言处理领域，本发明包括：外部知识辅助阶段，对源文本词汇对齐集合进行多层次检索匹配；大模型翻译阶段，得到大模型翻译集合，将大模型翻译集合作为候选翻译之一；后选择阶段，将获取的源文本词对齐集合和外部字典词对齐集合、实体库对齐集合、辅助翻译集合的嵌入表征、大模型翻译集合分别进行多次的相似度计算打分，根据相似度得分进行筛选以得到候选词对齐集合；根据任务设计提示模板，将源文本词对齐集合和候选词对齐集合放到提示模板中，通过高度对齐的外部词对齐集合供大模型上下文学习生成最佳翻译结果；本发明在缓解了大模型在低资源环境下各种翻译错误。

技术关键词

机器翻译方法语法结构机器翻译模型文本双语对齐语料实体字典模板在线学习机制子模块多层次词向量表征阶段动态更新语义无监督检索策略结构封装编码器

系统为您推荐了相关专利信息

一种基于微调大语言模型的推荐数据增强方法

大语言模型微调技术项目数据推荐系统

基于大模型的数据预测方法、系统及存储介质

数据预测方法对象模拟模型样本音频特征

知识图谱驱动的水利智能问答互动平台及方法

知识图谱驱动实体标识符水利实体消歧自然语言

信息展示方法、装置、电子设备及存储介质

人工智能互动信息展示方法文本页面主题

方面级多模态情感分析方法、系统、设备及介质

交互特征词特征融合特征文本图像

基于词粒度对齐的大模型上下文学习机器翻译方法

站点导航

APP 下载