摘要
本申请公开了一种文本处理方法、装置、设备、存储介质及程序产品,其中,所述方法包括:基于目标文档结构模式,对初始文本进行第一分段,得到包括多个初始段落的待处理文本;对所述初始段落进行第二分段,得到包括多个分段段落的分段文本;基于各所述分段段落的语义信息和分段位置信息,对所述初始段落对应的初始的段落合并模型进行训练,得到训练后的段落合并模型;所述段落合并模型用于将所述多个分段段落合并为至少两个目标段落;利用所述训练后的段落合并模型对所述多个分段段落进行合并,得到所述初始段落对应的至少两个目标段落。这样,使得最终分段更具语义内聚性,减少了分段之间的语义相关性。
技术关键词
分段
文本处理方法
模式匹配
语义
文本处理装置
处理器
模块
计算机程序产品
基础
计算机设备
可读存储介质
存储器
因子
指令
参数
系统为您推荐了相关专利信息
自主导航方法
卷积神经网络识别
SLAM地图
语义场景
传感器
情绪识别方法
情感识别模型
分布式语义特征
情绪识别模型
数据