一种针对LLM翻译示例选择的Embedding模型训练方法、系统、电子设备及存储介质

正文

推荐专利

申请号：CN202411696785

申请日期：2024-11-26

公开号：CN119204044B

公开日期：2025-03-11

类型：发明专利

摘要

本发明公开了一种针对LLM翻译示例选择的Embedding模型训练方法、系统、电子设备及存储介质，所述方法首先通过翻译质量评估模型选择和LLM翻译质量直接相关的正负例，然后利用这些正负例对Embedding模型进行再训练，并调整了再训练时的损失函数，使得通过再训练Embedding模型获取到的翻译示例能够显著提升LLM的翻译质量。相比于传统方法训练的Embedding模型仅关注与待翻译句子语义相近的示例，本发明中再训练后的Embedding模型则关注于那些能够直接提升待翻译句子翻译质量的示例。

技术关键词

模型训练方法双语语料库文本模型训练系统电子设备可读存储介质处理器模块编码度量存储器计算机语义程序

一种针对LLM翻译示例选择的Embedding模型训练方法、系统、电子设备及存储介质

站点导航

APP 下载