摘要
本发明提供了一种煤矿垂直领域大模型的构建方法及装置,涉及深度学习技术领域,所述方法包括:获取领域语料库数据和通用语料库数据,并分别基于领域语料库数据和通用语料库数据构建领域词表和通用词表;将通用词表和领域词表中的各个分词,基于各自的权重进行加权融合,得到融合词表;基于融合词表,利用领域语料库数据和通用语料库数据对嵌入模型进行训练;加载预训练的原始大语言模型,并将训练完成的嵌入模型替换至原始大语言模型的嵌入层,得到更新后的大语言模型;利用领域语料库数据和通用语料库数据对更新后的大语言模型进行增量预训练,得到煤矿垂直领域大模型。本发明构建的煤矿垂直领域大模型实现了对煤矿行业专业知识的精准表达。
技术关键词
分词
大语言模型
线性
频率
地质勘探报告
设备监测数据
语义
数据比
深度学习技术
煤矿行业
参数
矩阵
模块
核心
论坛
矿井
批量
格式
系统为您推荐了相关专利信息
动态评估系统
农村
数字物流系统
物联网传感器
人工智能算法
监测系统
建立预测模型
数据库系统
预警模块
预警机制
轨迹跟踪方法
GP模型
轮式
激光雷达传感器
误差预测
智能测试系统
通信数据管理
误差参数
信号控制单元
保护隔离单元