摘要
本说明书实施例提供了模型训练方法及装置,其中,一种模型训练方法包括:在模型训练过程中,通过对信用服务的服务推荐数据进行预处理获得预处理数据,将预处理数据与提示文本输入第一语言模型进行预处理数据与服务策略的匹配处理获得策略匹配评分,并基于评分标签与策略匹配评分对第一语言模型进行微调,以此在微调完成后获得样本生成模型,进一步通过样本生成模型生成样本服务数据和样本标签,并从样本服务数据和样本标签出发对第二语言模型进行训练获得评分模型,以此通过自然语言模型的微调和训练的配合获得评分模型。
技术关键词
模型训练方法
策略
样本
标签
计算机可执行指令
文本
数据采集模型
模型训练设备
自然语言模型
模型训练装置
集成训练
模型训练模块
处理器
订单
冗余度
可读存储介质
网络