基于双重语义对齐的中英双语中草药和靶点实体识别方法

正文

推荐专利

申请号：CN202411446139

申请日期：2024-10-16

公开号：CN119294397A

公开日期：2025-01-10

类型：发明专利

摘要

本发明提供了一种基于双重语义对齐的中英双语中草药和靶点实体识别方法，包括设置中英文两种语言的实体对照语料库；利用编码器mBERT模型计算多语言对齐所需的损失函数；计算专业语义对齐所需的损失函数；计算正则化项；计算损失函数的总和并训练mBERT模型；在保持步骤五中训练后mBERT模型的部分参数不变的情况下，同时训练编码器mBERT模型和解码器CRF。本发明通过双重语义对齐技术，改进了传统实体识别方法，包括多语言对齐和专业语义对齐，以及部分微调策略，提高了跨语言文本中实体识别的准确性和鲁棒性，通过在基准数据集上的验证，证明了其相较于现有技术在性能上的显著提升。

技术关键词

实体识别方法中草药语义编码器多语言计算机可读取存储介质中英文对照专业解码器对齐技术词典定义处理器通信模块参数识别装置同义词鲁棒性

系统为您推荐了相关专利信息

无监督抽取式文本摘要方法

文本摘要方法核心列表单文档摘要无监督

数字营销方法、系统、存储介质及计算机

营销方法分布式大数据客户图像解码器数字营销系统

训练图像的处理方法、识别方法、相关设备及存储介质

语义分割模型图像样本识别方法处理单元

一种融合地理信息的VR旅游场景生成方法及系统

融合地理信息旅游场景生成方法开放街道地图数字高程模型

一种基于概念的自解释文本分类方法及装置

文本分类器文本分类方法文本分类装置编码特征抽取器

基于双重语义对齐的中英双语中草药和靶点实体识别方法

站点导航

APP 下载