摘要
本发明公开了一种针对LLM翻译示例选择的Embedding模型训练方法、系统、电子设备及存储介质,所述方法首先通过翻译质量评估模型选择和LLM翻译质量直接相关的正负例,然后利用这些正负例对Embedding模型进行再训练,并调整了再训练时的损失函数,使得通过再训练Embedding模型获取到的翻译示例能够显著提升LLM的翻译质量。相比于传统方法训练的Embedding模型仅关注与待翻译句子语义相近的示例,本发明中再训练后的Embedding模型则关注于那些能够直接提升待翻译句子翻译质量的示例。
技术关键词
模型训练方法
双语语料库
文本
模型训练系统
电子设备
可读存储介质
处理器
模块
编码
度量
存储器
计算机
语义
程序