摘要
本申请涉及一种文本段落识别方法、装置、计算机设备、可读存储介质和程序产品,涉及大数据技术领域。方法包括:接收针对目标文本的段落识别指令,获取目标文本中的目标文本行的第一文本信息、以及目标文本行的上一文本行的第二文本信息;分别通过语义分析模型和词组分析模型,对第一文本信息和第二文本信息之间进行语义关联分析和词组关联分析,得到第一文本信息和第二文本信息之间的语义关联性和词组关联分析结果。在语义关联性达到关联性阈值、以及词组关联分析结果表示第一文本信息包含第二文本信息的关键词组的情况下,将目标文本行与上一文本行归为同一段落。采用本方法能够提高文本段落识别准确性。
技术关键词
语义分析模型
分词
安全性检测
文本段落
样本
卷积神经网络训练
语义特征提取
长短期记忆网络
词频统计
识别方法
计算机设备
分析模块
可读存储介质
标识
频率
大数据技术
指令