摘要
本发明涉及海关数据处理技术领域,提出了一种基于提示学习的海关税收风险知识抽取方法,建立海关风险知识抽取的数据源:输入通用预训练命名实体识别模型抽取企业实体名称,并利用依存句法优化实体命名结果,得到候选名称;将候选名称放入提示学习语言模型进行验证,输出概率最高的企业实体名称;再进行风险评价提取:基于预训练语言模型的提示学习来对报道正负面做文本分类预测;最后将提取出企业实体名称、风险评价信息进行特征融合,并录入海关报关单数据库。提高实体命名识别的准确性,并解决了对海关风险信息领域的样本信息少,抽取任务准确率低的问题。
技术关键词
知识抽取方法
命名实体识别
企业
实体命名识别
语句
预训练语言模型
依存句法分析
海关报关单
风险
文本
语义角色标注
标记
数据处理技术
分词
系统为您推荐了相关专利信息
数字化展示方法
展示模板
关键词
文本
数据生成图像
模态特征
历史视频检索
视频检索方法
语句
融合特征
核密度估计方法
累积分布函数
高斯核函数
大数据计算技术
样本