摘要
本发明属于自然语言处理领域,特别是涉及一种基于结构化语义知识增强的数据识别方法。该方法包括:1)将经过处理和清洗后的数据集文本输入到文本编码器中,获得文本特征向量。2)对于经过处理和清洗后的数据集文本,使用基于Transformer的自动抽象语义表示解析器来获得相应的抽象语义表示图。在获得抽象语义表示图之后,通过确定性拓扑增强和概率性拓扑增强策略生成内聚子图,3)采用图编码器从抽象语义表示图和它们的内聚子图中提取相应的图特征向量。4)采用对比学习区分具有不同相似度的图文对。5)得到训练模型后,通过抽取事件测试效果。
技术关键词
数据识别方法
语义
文本特征向量
文本编码器
样本
解析器
节点
确定性规则
锚点
三元组
图文
解码算法
数据标签
网络
注意力机制
策略性
系统为您推荐了相关专利信息
文本
模板
电子设备
人工智能技术
计算机程序产品
海洋牧场
模块
支路
自主水下航行器
检测模型训练
大语言模型
优化调度方法
综合能源系统调度
编码体系
优化调度模型
深度学习神经网络
分级结构
医学成像
图形用户界面
手册