摘要
本发明提供了一种面向中医医案文本的层次化向量表示方法、装置、设备及存储介质。该方法包括:确定中医医案的结构化本体设计;获取中医领域的专业医案数据;对专业医案数据进行预处理;对中医医案进行结构化信息抽取,获取元素级、字段级和多字段级各类型数据;基于领域增强预训练后的RoBERTa模型构建元素级向量表示模型,获取元素级数据语义表征;对于序列数据,基于元素级向量表示模型获取语义表征;针对元素集合数据基于Self‑Attention网络聚合元素间语义,获取其语义表征;多字段图节点特征初始化;基于图注意力网络获取中医医案文本的向量表示。本方案充分考虑中医医案文本结构特点,能够实现对中医医案文本的精细化信息语言表征。
技术关键词
中医医案
元素
语义
计算机可读取存储介质
数据编码
序列
注意力
计算机可读指令
专业
数值
主题
文本识别
节点特征
网络架构
数据格式
模板
系统为您推荐了相关专利信息
表面缺陷检测方法
螺栓缺陷
电磁旋转装置
非暂态计算机可读存储介质
语义特征
化计算方法
显卡
图像检测系统
语义特征
注意力机制