摘要
一种外贸领域大模型构建方法,1)准备用于外贸领域大模型有监督指令微调的训练与测试数据;2)数据预处理,对整合的所有数据进行清洗,对数据进行预处理,包括去除噪声、标准化格式、分割对话、去重等操作,以确保数据的质量和一致性;3)加载LLaMA2‑7B模型,利用人工标志好的部分领域数据与开源的无害性数据训练奖励模型,以获得更符合领域意图和无害性的奖励模型;4)利用训练好的奖励模型反向清洗1)和2)过程所整合所有指令跟随数据;5)加载指令跟随微调后的大模型和奖励模型,采用强化学习中近端优化策略对SFT模型进行训练,以获得符合领域用户意图的大模型。
技术关键词
模型构建方法
开源数据库
意图
指令
人工标志
人工标记
代码库
人类
格式
策略
噪声
语义
算法
文本
参数
系统为您推荐了相关专利信息
模型设计方法
图像
视觉
多头注意力机制
计算机装置