文本数据处理方法及装置、存储介质及电子设备

正文

推荐专利

申请号：CN202511254175

申请日期：2025-09-03

公开号：CN120821828A

公开日期：2025-10-21

类型：发明专利

摘要

本公开提供了一种文本数据处理方法及装置、存储介质及电子设备，涉及计算机技术领域。该方法包括：获取待处理文本；若所述待处理文本超过长度阈值，则基于语义单元的边界对所述待处理文本进行分块处理，生成多个语义连续且长度不超过所述长度阈值的文本块；其中，所述长度阈值根据文本处理模型的词元处理长度确定；将所述文本块输入所述文本处理模型进行处理，获得所述待处理文本的信息提取结果。该方法可以基于语义单元边界对待处理文本进行分块处理，确保生成的文本块语义连续且长度符合模型处理要求，避免因文本过长导致模型处理困难，同时保证语义完整性，在实现对长文本有效处理的同时，有利于提高模型信息提取的准确性。

技术关键词

文本处理模型文本数据处理方法样本语义分块加权损失函数文本数据处理装置复杂度自然语言电子设备处理器动态存储装置参数可读存储介质程序实体标签机制

系统为您推荐了相关专利信息

一种基于时序模型的湿法炼锌数字孪生构建方法

时序预测模型长短期记忆网络数字孪生离子样本

一种基于姿态引导与特征融合的遮挡行人重识别方法

局部视觉语义重识别方法姿态特征行人重识别模型语义特征

基于深度神经网络的物联网异常流量识别方法与系统

异常流量深度神经网络双向长短期记忆焦点损失函数识别方法

一种基于权重调整的模型对抗迁移性风险评估方法和系统

风险评估方法样本指数参数风险评估系统

一种商品电子券推荐方法、装置、设备及存储介质

商品特征偏好特征电子券推荐方法重构矩阵

文本数据处理方法及装置、存储介质及电子设备

站点导航

APP 下载