摘要
本发明一种基于大模型增强与多特征融合的医疗命名实体识别方法,首先通过大语言模型增强层构建增强训练数据作为输入,多特征嵌入层将输入数据的字符语义嵌入、实体区域嵌入和边界距离嵌入进行融合,将多特征融合嵌入输入至DConv‑MLP模块内利用膨胀卷积和多层感知机进行多尺度特征提取并将最终的多特征融合嵌入输入至上下文编码层中,通过双向长短时记忆网络和迭代扩张卷积神经网络提取全局语义特征,同时分别通过头尾双向长短时记忆网络和边界链机制捕捉实体的头尾边界特征,然后利用双仿射机制将全局语义特征与头尾边界特征融合得到最终输出结果,将最终输出结果输入解码层采用条件随机场对序列标注进行优化,并通过对数似然损失函数进行模型训练。
技术关键词
实体
卷积神经网络提取
多层感知机
多尺度特征提取
边界特征
条件随机场
序列
大语言模型
训练语言模型
语义特征提取
字符
标签
头部特征
Softmax函数
计算方法
矩阵乘法运算
系统为您推荐了相关专利信息
预警模型构建方法
网络
无标签样本
语义特征
多层感知机
人脸活体检测方法
顶点特征
模糊C聚类
图像块
三元组损失函数
食谱生成方法
大语言模型
食谱生成系统
命名实体识别
数据收集模块
隧道缺陷
识别方法
多尺度谱聚类
平均Hausdorff距离
神经网络算法