摘要
本发明提供了一种目标语种类型的文本处理方法、装置及设备,属于计算机信息处理技术领域,解决了目标语种命名实体识别标注失真、边界模糊、数据稀缺问题。该方法包括:获取带有标注的目标语种的文本数据;对带有标注数据的目标语种的文本数据进行校正和转换处理,得到预设格式的第一目标文本数据;对预设格式的第一目标文本数据进行转换和修正处理,得到转换后的第二目标文本数据;对转换后的第二目标文本数据进行动态拆分处理,得到拆分后的第三目标文本数据;将拆分后的第三目标文本数据输入文本识别模型进行处理,得到目标语种类型的文本识别结果数据。该方案提升了目标语种文本的实体标注效率与识别精度。
技术关键词
文本处理方法
文本识别模型
训练文本数据
格式
训练样本数据
识别误差
动态滑动窗口
校正
文本处理装置
标签
命名实体识别
序列
计算机
可读存储介质
列表
系统为您推荐了相关专利信息
分布式存储集群
全球通
校验规则
实时状态信息
指令
数据处理单元
智能网卡
故障恢复方法
FPGA芯片
虚拟设备
快速生成方法
参数赋值方法
模型生成方法
计算机系统执行
命令
跟踪测试系统
信息处理机
投影模型
图像
姿轨控计算机
财务管理系统
构建预测模型
数据采集模块
分析模块
分析财务数据