文本处理方法、装置、设备、存储介质及程序产品

AITNT
正文
推荐专利
文本处理方法、装置、设备、存储介质及程序产品
申请号:CN202411040382
申请日期:2024-07-30
公开号:CN118861249A
公开日期:2024-10-29
类型:发明专利
摘要
本申请公开了一种文本处理方法、装置、设备、存储介质及程序产品,其中,所述方法包括:基于目标文档结构模式,对初始文本进行第一分段,得到包括多个初始段落的待处理文本;对所述初始段落进行第二分段,得到包括多个分段段落的分段文本;基于各所述分段段落的语义信息和分段位置信息,对所述初始段落对应的初始的段落合并模型进行训练,得到训练后的段落合并模型;所述段落合并模型用于将所述多个分段段落合并为至少两个目标段落;利用所述训练后的段落合并模型对所述多个分段段落进行合并,得到所述初始段落对应的至少两个目标段落。这样,使得最终分段更具语义内聚性,减少了分段之间的语义相关性。
技术关键词
分段 文本处理方法 模式匹配 语义 文本处理装置 处理器 模块 计算机程序产品 基础 计算机设备 可读存储介质 存储器 因子 指令 参数
系统为您推荐了相关专利信息
1
基于北斗+多源信息自适应融合的无人系统自主导航方法
自主导航方法 卷积神经网络识别 SLAM地图 语义场景 传感器
2
人声音质优化方法、装置、设备及介质
编码特征 音频编码 谐波 层级 语义
3
一种基于CNN模型的语音数据情感与情绪识别方法
情绪识别方法 情感识别模型 分布式语义特征 情绪识别模型 数据
4
基于事件与图像双向协同引导的低光照增强方法
事件特征 图像 滤波器 光照 峰值信噪比
5
实体和关系的联合抽取方法、装置、设备及介质
联合抽取方法 实体 三元组 关系 音频
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号