摘要
本申请公开了一种训练文本的生成方法、模型训练方法及实体识别方法,涉及自然语言处理技术领域。训练文本的生成方法,包括:识别目标工程机械文本中的多个工程机械实体以及对应的实体类别;基于多个工程机械实体进行拓展,得到多个第一工程机械文本;生成与目标工程机械文本相似的多个第二工程机械文本;识别多个第二工程机械文本中的实体以及对应的实体类别;将多个第一工程机械文本与多个第二工程机械文本进行相似度匹配,筛选得到相似度大于第一相似度阈值的第三工程机械文本;对第三工程机械文本进行验证,并根据验证通过的第三工程机械文本与对应的实体,得到训练文本。实现了自动化地对目标工程机械文本进行标注并生成足够的相似的文本。
技术关键词
工程机械
实体识别方法
模型训练方法
实体识别模型
生成方法
文本生成模型
机器可读存储介质
指令
自然语言
合规性
存储器
数据
处理器
系统为您推荐了相关专利信息
纹理模型
多角度
纹理特征
纹理生成方法
人物模型
设计生成方法
卷积神经网络模型
多模态
资源
元素