摘要
本发明属于垂域大模型领域,具体涉及一种基于专业知识语料的电力行业招采大模型构建方法及系统。该方法包括:采集语料中所有专业词汇的出现频率,并根据频率的高低进行排序;构建每一个专业词汇与其出现频率的对应表;基于所述对应表,采用基于频率的压缩编码方法对专业词汇进行编码处理,生成编码数据并发送至训练端;训练端直接提取编码数据中的专业词汇频率信息,构建专业语料数据集,并通过该数据集训练得到大模型。通过在采集端完成关键词频率提取与压缩编码,训练端可直接基于编码数据进行建模,无需重新解析原始文本,能够有效减少数据处理时间与计算资源消耗,提升整体训练效率,适用于电力行业招采场景下的大模型构建。
技术关键词
模型构建方法
节点
专业
模型构建系统
频率
压缩编码方法
生成编码数据
时序
终端
处理器
可读存储介质
关键词
逻辑
指令
服务器
文本
计算机
场景