基于检索增强的多语言机器翻译方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
基于检索增强的多语言机器翻译方法、装置、电子设备及存储介质
申请号:CN202510639295
申请日期:2025-05-19
公开号:CN120409501A
公开日期:2025-08-01
类型:发明专利
摘要
本发明公开了一种基于检索增强的多语言机器翻译方法、装置、电子设备及存储介质。该方法收集了多语言数据集,对所述数据集进行了系统化的数据预处理;将预处理后的数据进行语种识别和领域划分,并进行分词和字节对编码;得到编码后的稠密向量,构建了包括英语,德语,法语,意大利语,汉语,日语的多语言检索增强数据库;将待翻译句子通过领域主题识别模型进行识别,将待翻译句子作为查询通过基于文本嵌入的检索算法和基于单词匹配的检索算法,检索出相似句对;通过提示模板指导大模型生成待翻译句子的翻译,并通过大模型译文质量评价选择出最佳译文。本发明通过检索增强的方式,有效地提高了模型对于低资源以及跨领域场景下的适应能力,提高了多语言机器翻译的翻译质量。
技术关键词
机器翻译方法 预训练语言模型 多语言 检索算法 数据 模板 语种识别 训练集 分词 向量检索方法 主题 文本检索方法 清洗单元 编码 识别模块 电子设备
系统为您推荐了相关专利信息
1
应用词向量与交叉网络进行出行中转排序的方法及系统
神经网络模型 站点 数据 城市特征 标记
2
一种基于多源数据融合的短视频平台获客方法
获客方法 短视频 平台 感兴趣 表达式
3
一种大功率半导体器内的应力去除方法及系统
应力 芯片 开关作业 数据 参数
4
一种基于seq2seqLSTM的中长期径流多预见期联合预报方法
径流 预报方法 长短期记忆神经网络 因子 序列
5
一种键合金丝键合工装质量检测的方法及系统
键合工装 键合金丝 解析算法 粗糙度 弹性零件
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号