摘要
本发明公开了一种基于CRF标记学习的事件因果关系挖掘方法,包括:对选取的参考数据集进行数据预处理,通过关系抽取提取四元组数据;构建Re‑net基线模型,在所述Re‑net基线模型中结合CRF算法,聚类生成辅助判别的伪标记,连接前向后向隐藏状态,观测标签序列的上下文信息,使用CRF进行标签序列建模,构建第一挖掘模型;将预处理后的数据输入所述第一挖掘模型进行训练并通过最大概率准则优化,在评价指标达标后获得优化完毕的第一挖掘模型;利用所述优化完毕的第一挖掘模型对大规模文本数据进行事件因果关系的挖掘。
技术关键词
因果关系挖掘方法
CRF算法
标记
大规模文本数据
关系抽取算法
序列
标签
基线
带时间
节点特征
对象
BERT模型
聚类
指标
定义
分词
系统为您推荐了相关专利信息
场景变换检测
标签生成系统
标签生成方法
视频动态信息
关键帧
大语言模型
推荐方法
语义特征
项目特征
交互历史
特征点描述符
轮廓区域
图片
梯度方向直方图
坐标
液相基因芯片
标记
试剂盒
全基因组关联分析
液相芯片技术
医疗信息管理系统
医疗信息管理方法
资源库
信息处理单元
字符