摘要
本发明公开了一种非遗文本语料库构建与命名实体识别方法及系统,其中方法步骤包括:采集大量非物质文化遗产的相关文本资料;基于相关文本资料,构建非遗语料库;基于非遗语料库,构建实体识别模型;利用实体识别模型,完成非遗文本语料的命名实体识别。本发明构建了高质量的非遗文本语料库,并提出了实体识别模型,通过动态全词掩码策略和特殊的特征提取、学习方法,显著提升了非遗文本中命名实体识别的准确性,为非遗知识图谱构建和文化传播提供了有力支持。
技术关键词
命名实体识别方法
实体识别模型
非物质文化遗产
命名实体识别系统
双向长短期记忆网络
特征提取模块
掩码策略
语义特征
字符
资料
文本
知识图谱构建
条件随机场
识别模块
预训练模型
标签
学习方法
系统为您推荐了相关专利信息
情绪识别方法
声学特征
双向长短期记忆网络
视频帧特征
音频
深度学习网络模型
序列检测
双向长短期记忆网络
转录组测序数据
基因组测序数据
事件抽取方法
文档特征
金融
双向长短期记忆网络
文本
数据处理方法
数据处理程序
设备状态参数
字段
数值