摘要
本发明提供一种藏文司法事件抽取方法、系统、存储介质和电子设备,涉及自然语言处理领域。本发明基于预先训练好的深度学习网络,方法包括:首先获取待分析的藏文文本,采用CINO预训练语言模型获取动态上下文语义表示;其次基于动态上下文语义表示,采用BiLSTM和CNN混合神经网络分别获取上下文时序特征、局部特征;接着融合上下文时序特征、局部特征,获取藏文文本的全局语义特征;再次基于全局语义特征,采用CRF模型识别事件触发词或论元角色;最后合并识别的事件触发词和论元角色,作为待分析的藏文文本的每个藏文音节在BIO标注体系下的分类预测结果。本发明缓解低资源语言数据资源的约束,有效提升藏文司法事件检测和论元识别两个任务上的整体效果。
技术关键词
动态上下文
事件抽取方法
深度学习网络
时序特征
事件抽取系统
语义特征
CRF模型
训练语言模型
标签
文本
裁判文书
预测类别
序列特征
低资源语言
两阶段
计算方法
参数
电子设备
系统为您推荐了相关专利信息
宽度检测单元
压力检测单元
水分分析仪
特征提取单元
控制系统
误差补偿模型
广播星历数据
深度学习网络
预测误差
序列特征
温度动态控制系统
光纤光棒
多输入多输出系统
历史温度数据
摄像机阵列