摘要
本公开是关于一种文本标签的标注方法、装置及系统。其中,方法包括:从待标注文本中获取目标分词,利用标签生成模型,根据标签库生成目标分词的初始标签,采用多种相似度计算方式计算初始标签与同义词库中每个候选标签的相似度值,得到多个相似度值,对多个相似度值进行归一化处理,将归一化处理后的多个相似度值进行排序,得到第一顺序,按照第一顺序,确定多种匹配方式的第二顺序,依次按照第二顺序对应的匹配方式将初始标签与同义词库中的候选标签进行匹配,直至得到至少一个目标候选标签为止,采用初始标签和至少一个目标候选标签对目标分词进行标注。本方案提升了文本标签的全面性。
技术关键词
标签
同义词
标注方法
编辑距离算法
文本
分词
处理器
标注装置
计算机程序产品
语义
可读存储介质
关系
存储器
电子设备
频率
系统为您推荐了相关专利信息
教学管理方法
时间序列特征
模糊集合
模糊库
教师
视频生成模型
语义向量
文本
运动特征
预训练语言模型
运维决策方法
高压变压器
构建知识图谱
大语言模型
节点
测试用户界面
自动化测试方法
元素
测试接口
意图