摘要
本申请提供一种实体标记方法、电子设备、存储介质及计算机程序产品。该方法包括:基于预设的特征函数集获得待标记文本中的每个单词被标记为预先设定的各标签的特征向量;特征向量中的元素值与特征函数集中的特征函数对应,元素值为利用对应的特征函数对当前单词、当前单词的前一个词、当前单词的前两个词、当前单词的标签、前一个词的标签和前两个词的标签中的至少一个进行规则验证获得;将特征向量输入实体标记模型,获得实体标记模型输出的单词属于各个标签的条件概率;实体标记模型为基于训练样本,利用平均感知器算法对最大熵模型进行训练获得;根据条件概率确定单词对应的目标实体标签。本申请减少了人工分析时间和计算机的计算成本。
技术关键词
平均感知器算法
标签
实体
文本
标记方法
计算机程序产品
计算机程序指令
电子设备
处理器
分词
元素
存储器
参数
因子
系统为您推荐了相关专利信息
数据治理系统
数据标签
实体
多模态
分层存储机制
预训练语言模型
语句
数据组织结构
数据查询方法
检查规则