摘要
本发明公开了一种基于多任务学习的煤地质领域句子语义嵌入建模方法,包括以下步骤:煤地质语料采集与预处理;构建并标注地质实体词典,生成地质领域专属实体数据集;基于中文BERT模型,建立多任务学习模型结构;使用训练好的模型,对煤地质领域的语句进行句向量生成向量提取与评估;将本发明提出的基于多任务学习模型应用于下游场景。本发明采用上述一种基于多任务学习的煤地质领域句子语义嵌入建模方法,通过联合优化句子向量建模与实体识别任务,使模型能够更加精准地理解煤中关键金属元素与矿物之间的语义关系,从而输出更具领域语义特征的句子表示,提升煤地质文本的理解、归类与知识表达能力。
技术关键词
多任务学习模型
建模方法
BERT模型
语义
命名实体识别
联合损失函数
Pearson相关系数
维特比算法
字典结构
条件随机场
多任务联合训练
标签
生成向量
序列标注模型
词典
术语标准化
语句