摘要
本发明提出一种基于医学领域特征的文本数据主客体关联关系抽取方法,包括:利用编码器从待抽取的医学文本中提取特征信息,并对医学文本中的上下文信息进行编码,获取医学文本的编码向量;构建医学主体标记器,依据编码向量,对医学文本中的主体实体的起始位置和结束位置进行标记;采用似然函数优化医学主体标记器,并获取医学文本中的主体实体列表;构建医学关系标记器,对主体实体列表中的每个主体实体的医学关系进行建模,并通过星型拓扑结构进行语义增强,识别与主体实体相关的对象,并提取关系特征;采用似然函数优化医学关系标记器,并完成基于医学领域特征的文本数据主客体关联关系抽取。
技术关键词
关系抽取方法
医学
标记器
实体
星型拓扑结构
编码向量
字符
LSTM模型
中继节点
对象
编码器
数据
列表
多头注意力机制
文本特征向量
系统为您推荐了相关专利信息
特种设备
多源异构数据处理
实体
原型
非结构化文本
导航多媒体
实体
意图识别方法
座舱环境控制
意图识别技术