一种目标语种类型的文本处理方法、装置及设备

正文

推荐专利

申请号：CN202510891902

申请日期：2025-06-30

公开号：CN121031597A

公开日期：2025-11-28

类型：发明专利

摘要

本发明提供了一种目标语种类型的文本处理方法、装置及设备，属于计算机信息处理技术领域，解决了目标语种命名实体识别标注失真、边界模糊、数据稀缺问题。该方法包括：获取带有标注的目标语种的文本数据；对带有标注数据的目标语种的文本数据进行校正和转换处理，得到预设格式的第一目标文本数据；对预设格式的第一目标文本数据进行转换和修正处理，得到转换后的第二目标文本数据；对转换后的第二目标文本数据进行动态拆分处理，得到拆分后的第三目标文本数据；将拆分后的第三目标文本数据输入文本识别模型进行处理，得到目标语种类型的文本识别结果数据。该方案提升了目标语种文本的实体标注效率与识别精度。

技术关键词

文本处理方法文本识别模型训练文本数据格式训练样本数据识别误差动态滑动窗口校正文本处理装置标签命名实体识别序列计算机可读存储介质列表

系统为您推荐了相关专利信息

一种分布式存储集群部署方法、装置、设备及存储介质

分布式存储集群全球通校验规则实时状态信息指令

故障恢复方法、装置和智能网卡

数据处理单元智能网卡故障恢复方法 FPGA芯片虚拟设备

一种仿真样本库快速生成方法

快速生成方法参数赋值方法模型生成方法计算机系统执行命令

红外目标搜索识别及跟踪测试系统及方法

跟踪测试系统信息处理机投影模型图像姿轨控计算机

一种基于数据特征分析的智能财务管理系统

财务管理系统构建预测模型数据采集模块分析模块分析财务数据

一种目标语种类型的文本处理方法、装置及设备

站点导航

APP 下载