摘要
本申请公开了一种文本识别模型的训练方法、装置、设备及存储介质,涉及计算机技术领域。所述方法包括:获取训练数据集,训练数据集包括至少一个训练样本,每个训练样本包括样本文本和样本文本对应的样本识别结果;根据样本文本,得到样本文本对应的相关词集合,相关词集合包括至少一个样本词汇,每个样本词汇包括样本文本中至少一个连续的字符;通过文本识别模型根据相关词集合,得到样本文本对应的至少两个预测输出结果;根据样本识别结果和至少两个预测输出结果,调整文本识别模型的参数,得到训练后的文本识别模型。本申请避免了模型虚构的问题,让文本识别模型所提取到的实体识别结果是合理且有事实依据的,提高了实体识别的准确性。
技术关键词
文本识别模型
样本
实体
格式
计算机程序产品
字符
计算机设备
模型训练模块
可读存储介质
参数
数据获取模块
处理器
训练装置
输出模块
存储器
数值
系统为您推荐了相关专利信息
生成系统
水库
接口集成模块
人机交互模块
数据处理模块
路基沉降预测方法
沉降监测数据
深度学习算法
路基沉降预测系统
粒子群算法
区域预测方法
机器学习算法模型
模型训练模块
训练集
预测系统
力预测方法
机器学习模型
矫直机设备
LightGBM模型
参数