一种获取命名实体识别模型的数据处理方法

正文

推荐专利

一种获取命名实体识别模型的数据处理方法

申请号：CN202410997258

申请日期：2024-07-24

公开号：CN118690751B

公开日期：2025-12-26

类型：发明专利

摘要

本申请涉及电数字数据处理技术领域，特别是涉及一种获取命名实体识别模型的数据处理方法。所述方法包括以下步骤：遍历data，如果使用datase对命名实体识别模型进行训练时对datase进行了第mt个预设类型的实体的标注，则将datase中第mt个预设类型的实体的正样本占比确定为datase的第mt个权值qzse,mt；否则，设置qzse,mt为0；根据qzse,mt、cb和zb确定从新增文本集中获取用于对所述经训练的命名实体识别模型进行训练的最优文本数量。本发明能够获取较优的新的训练样本的数量。

技术关键词

命名实体识别模型文本数据处理方法电数字数据处理技术样本计算机可读指令标签处理器

系统为您推荐了相关专利信息

个性化儿童术后疼痛管理方法与系统

个性化疼痛管理深度神经网络管理方法医学影像信息疼痛管理系统

基于遥感图像分类任务的多模态协同对抗攻击方法及设备

遥感图像分类多模态遥感图像数据合成孔径雷达图像非暂态计算机可读存储介质

基于深度学习的多模态情感识别方法及系统

情感识别方法音频特征场景文本深度学习模型

一种基于联邦学习的月度分时电量预测方法

电量预测模型电量预测方法电量预测系统记忆单元客户端

一种多选项问题生成方法、装置、电子设备及存储介质

多模态子模块图像嵌入大语言模型答案

一种获取命名实体识别模型的数据处理方法

站点导航

APP 下载