摘要
本申请实施例提供了一种文本检测方法、装置、电子设备及计算机可读存储介质,涉及自然语言处理领域。该方法包括:将待检测文本划分为至少一个待检测片段,确定待检测片段的向量表示,基于向量表示从检索树中确定待检测片段对应的参考片段;根据待检测片段和对应的参考片段之间的语义相似度和待检测片段的TF‑IDF值,确定待检测片段的目标相似度;从各待检测片段中,选择目标相似度大于预设相似度阈值的待检测片段作为目标检测片段;目标检测片段以及对应的参考片段输入类型预测模型,获得输出的目标检测片段对应的一类抄袭类型,并生成检测结果。本申请解决了无法检测到经过深度处理的文本的抄袭情况和无法精准区分文本的抄袭类型的问题。
技术关键词
文本检测方法
语义
关键词
元素
字符
可读存储介质
样本
电子设备
节点
计算机程序产品
处理器
矩阵
聚类算法
滑动窗口
自然语言
同义词
输入模块
系统为您推荐了相关专利信息
行人属性识别方法
语义特征
文本编码器
匹配模块
位置先验信息
损伤检测方法
框架结构
结构损伤检测
样本
混合模块