摘要
本发明公开了多语言翻译模型的领域自适应微调方法及系统,涉及数据处理技术领域,包括:获得目标领域多语言文档库进行语义分割和回译处理,构建翻译混合微调数据集;搭建两阶段微调架构;在领域预训练阶段选取底座预训练大模型,利用LoRA技术冻结底座预训练大模型的预设比例原始参数,配置大模型微调参数,通过单语数据自训练捕获目标领域特征信息;在跨任务迁移阶段对底座预训练大模型进行自适应微调训练,构建多语言专业翻译大模型,并基于多语言专业翻译大模型执行多语言翻译反馈。本发明解决现有技术在多语言翻译任务中缺乏对专业领域语义适配能力的技术问题,达到提升翻译模型在多语种条件下对专业术语的识别准确性的技术效果。
技术关键词
微调方法
多语言翻译模型
两阶段
专业
参数
底座
语义
样本
微调系统
数据处理技术
性能监控
搭建模块
流水线
基础
图谱
平台
系统为您推荐了相关专利信息
风险预测模型
组织
高压开关站
异常事件
汽轮发电机组
地球自转参数
方程
地球参考系
状态转移模型
GNSS观测值
神经网络训练方法
物理
滑动窗口技术
数据训练神经网络
列表