翻译模型的训练方法、介质、计算机设备和程序产品

AITNT
正文
推荐专利
翻译模型的训练方法、介质、计算机设备和程序产品
申请号:CN202410872811
申请日期:2024-06-28
公开号:CN118410815B
公开日期:2024-09-03
类型:发明专利
摘要
翻译模型的训练方法、介质、计算机设备和程序产品,所述方法包括:获取翻译模型的第一翻译损失,所述第一翻译损失与翻译模型的目标输出词元和该目标输出词元的在前输出词元为相同词元的概率正相关,目标输出词元为翻译模型对输入信息中包括的多个输入词元进行翻译时期望输出的词元,在前输出词元为翻译模型在获取目标输出词元之前,对所述多个输入词元进行翻译得到的词元;获取所述多个输入词元对目标输出词元的第一贡献度和所述多个输入词元对在前输出词元的第二贡献度;基于第一贡献度和第二贡献度之间的相似度,对第一翻译损失进行调整,得到翻译模型的第二翻译损失;基于第二翻译损失对翻译模型进行训练。
技术关键词
翻译模型 注意力 计算机设备 矩阵 处理器 翻译方法 计算机程序产品 电商 样本 可读存储介质 存储器 平台 词语 指数
系统为您推荐了相关专利信息
1
一种基于神经网络的流域降雨径流预报方法及系统
降雨径流预报方法 立方体 雨量计 数据 降雨径流预报系统
2
一种基于分区模型的极地环境建筑热环境分析方法及装置
建筑热环境 分区模型 建筑供热系统 分析方法 热源
3
桥接芯片的静电放电检测恢复方法、装置和显示设备
静电放电检测 恢复方法 音视频 芯片 判断系统
4
焦化生产智能优化系统、设备及存储介质
智能优化系统 三维可视化平台 焦化 计算机执行指令 故障诊断模块
5
一种订单风险评估模型训练、订单风险评估方法及装置
订单 信息变更 风险评估模型训练 数据嵌入 风险评估方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号