摘要
本申请涉及电数字数据处理技术领域,特别是涉及一种获取命名实体识别模型的数据处理方法。所述方法包括以下步骤:遍历data,如果使用datase对命名实体识别模型进行训练时对datase进行了第mt个预设类型的实体的标注,则将datase中第mt个预设类型的实体的正样本占比确定为datase的第mt个权值qzse,mt;否则,设置qzse,mt为0;根据qzse,mt、cb和zb确定从新增文本集中获取用于对所述经训练的命名实体识别模型进行训练的最优文本数量。本发明能够获取较优的新的训练样本的数量。
技术关键词
命名实体识别模型
文本
数据处理方法
电数字数据处理技术
样本
计算机可读指令
标签
处理器
系统为您推荐了相关专利信息
个性化疼痛管理
深度神经网络
管理方法
医学影像信息
疼痛管理系统
遥感图像分类
多模态
遥感图像数据
合成孔径雷达图像
非暂态计算机可读存储介质
电量预测模型
电量预测方法
电量预测系统
记忆单元
客户端