基于词粒度对齐的大模型上下文学习机器翻译方法

AITNT
正文
推荐专利
基于词粒度对齐的大模型上下文学习机器翻译方法
申请号:CN202510829731
申请日期:2025-06-20
公开号:CN120893450A
公开日期:2025-11-04
类型:发明专利
摘要
本发明提供基于词粒度对齐的大模型上下文学习机器翻译方法,涉及自然语言处理领域,本发明包括:外部知识辅助阶段,对源文本词汇对齐集合进行多层次检索匹配;大模型翻译阶段,得到大模型翻译集合,将大模型翻译集合作为候选翻译之一;后选择阶段,将获取的源文本词对齐集合和外部字典词对齐集合、实体库对齐集合、辅助翻译集合的嵌入表征、大模型翻译集合分别进行多次的相似度计算打分,根据相似度得分进行筛选以得到候选词对齐集合;根据任务设计提示模板,将源文本词对齐集合和候选词对齐集合放到提示模板中,通过高度对齐的外部词对齐集合供大模型上下文学习生成最佳翻译结果;本发明在缓解了大模型在低资源环境下各种翻译错误。
技术关键词
机器翻译方法 语法结构 机器翻译模型 文本 双语对齐语料 实体 字典 模板 在线学习机制 子模块 多层次 词向量表征 阶段 动态更新 语义 无监督 检索策略 结构封装 编码器
系统为您推荐了相关专利信息
1
一种基于微调大语言模型的推荐数据增强方法
大语言模型 微调技术 项目 数据 推荐系统
2
基于大模型的数据预测方法、系统及存储介质
数据预测方法 对象 模拟模型 样本 音频特征
3
知识图谱驱动的水利智能问答互动平台及方法
知识图谱驱动 实体标识符 水利 实体消歧 自然语言
4
信息展示方法、装置、电子设备及存储介质
人工智能互动 信息展示方法 文本 页面 主题
5
方面级多模态情感分析方法、系统、设备及介质
交互特征 词特征 融合特征 文本 图像
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号