摘要
本发明公开了一种基于提示学习中关系抽取的医疗文本分类方法,包括提示模版的构建以及LM‑bert模型的改进,提示模版构建时加入了三个不同掩码,将第一掩码和第三掩码的实体设置为名词,将第二掩码的实体设置为介词,并且第一掩码和第三掩码存在关系语义;LM‑bert模型改进为添加与词嵌入分支并行的字嵌入分支,RoBERTa输出词向量和字向量,其中字向量经过一层LSTM训练后得到字在该句中更为丰富的语义信息,然后通过多头注意力机制与词嵌入相加后输出给分类器。本发明通过在掩码间建立语义关系以及词嵌入和字嵌入的结合,能够捕捉更为复杂的语义关系和上下文信息,提升分类准确性。
技术关键词
医疗文本分类方法
bert模型
模版
多头注意力机制
关系
语义
分类器
样本
实体
前馈神经网络
优化器
标签
分支
训练集
编码器
数据