基于持续学习与知识蒸馏的中文医疗连续实体识别方法

正文

推荐专利

申请号：CN202510335519

申请日期：2025-03-20

公开号：CN120337925A

公开日期：2025-07-18

类型：发明专利

摘要

基于持续学习与知识蒸馏的中文医疗连续实体识别方法，包括以下步骤：步骤1：将含有连续命名实体的中文医疗文本输入到CK‑CMCNER模型中，经过BERT编码层生成实体特征表示；步骤2：在特征提取层中，通过双向GRU模型捕捉词元间的前后向上下文信息，将正反向隐藏状态加权结合，得到更准确的词元特征表示；步骤3：在跨度表示层中，采用特定于实体类型的前馈网络对每个跨度的起始和终止位置编码，通过残差连接增强表示能力，并引入相对位置编码细化词元间位置信息，提升模型对嵌套或重叠实体的识别精度；步骤4：在多标签损失层中，通过二元交叉熵BCE损失函数对每种实体类型独立分类，并结合知识蒸馏技术，确保新知识学习不会导致旧知识遗忘。

技术关键词

跨度实体识别方法知识蒸馏技术 GRU模型 sigmoid函数文本编码器标签代表教师序列嵌套网络精度学生矩阵

系统为您推荐了相关专利信息

一种电气设备生产装配线用实时监测方法

电器组件实时监测方法图像采集设备核心分水岭算法

一种无菌配药室的壁挂式消毒喷雾泄露风险预测方法

无菌配药多层感知网络风险预测方法风险预测模型壁挂式

基于多重SATMDI的大跨度桥梁多阶模态涡振控制方法

跨度桥梁桥梁有限元模型结构振动控制广义频率

基于双重语义对齐的中英双语中草药和靶点实体识别方法

实体识别方法中草药语义编码器多语言

融合LSTM-GRU时序预测与模糊逻辑的农业变频监测方法及系统

农田环境 GRU模型监测方法模糊逻辑算法数据采集频率

基于持续学习与知识蒸馏的中文医疗连续实体识别方法

站点导航

APP 下载