摘要
本申请实施例提供了一种面向水泥行业的大模型训练方法、装置和存储介质,方法包括:获取面向水泥行业的待处理数据;根据预设业务场景,将所述待处理数据划分为多个子样本;基于所述多个子样本训练第一子模型,所述子样本和所述第一子模型一一对应;为各所述第一子模型设置面向水泥行业的标准问题的词汇表和计算参数表;以所述待处理数据为输入,基于所述标准问题的词汇表和所述计算参数表,训练第二子模型;以及以所述待处理数据为输入,基于所述标准问题的词汇表和所述计算参数表,训练所述第一子模型和所述第二子模型。本申请提供的技术方案用以解决现有技术训练精度低的问题。
技术关键词
答案
模型训练方法
参数
标签
数据格式
水泥
预训练模型
注意力机制
模型训练装置
计算机可执行指令
数据处理模块
样本
场景
精度