文本处理方法、装置、设备、存储介质及程序产品

正文

推荐专利

申请号：CN202411040382

申请日期：2024-07-30

公开号：CN118861249A

公开日期：2024-10-29

类型：发明专利

摘要

本申请公开了一种文本处理方法、装置、设备、存储介质及程序产品，其中，所述方法包括：基于目标文档结构模式，对初始文本进行第一分段，得到包括多个初始段落的待处理文本；对所述初始段落进行第二分段，得到包括多个分段段落的分段文本；基于各所述分段段落的语义信息和分段位置信息，对所述初始段落对应的初始的段落合并模型进行训练，得到训练后的段落合并模型；所述段落合并模型用于将所述多个分段段落合并为至少两个目标段落；利用所述训练后的段落合并模型对所述多个分段段落进行合并，得到所述初始段落对应的至少两个目标段落。这样，使得最终分段更具语义内聚性，减少了分段之间的语义相关性。

技术关键词

分段文本处理方法模式匹配语义文本处理装置处理器模块计算机程序产品基础计算机设备可读存储介质存储器因子指令参数

系统为您推荐了相关专利信息

基于北斗+多源信息自适应融合的无人系统自主导航方法

自主导航方法卷积神经网络识别 SLAM地图语义场景传感器

人声音质优化方法、装置、设备及介质

编码特征音频编码谐波层级语义

一种基于CNN模型的语音数据情感与情绪识别方法

情绪识别方法情感识别模型分布式语义特征情绪识别模型数据

基于事件与图像双向协同引导的低光照增强方法

事件特征图像滤波器光照峰值信噪比

实体和关系的联合抽取方法、装置、设备及介质

联合抽取方法实体三元组关系音频

文本处理方法、装置、设备、存储介质及程序产品

站点导航

APP 下载