摘要
本申请公开了一种违规文本识别方法、装置、设备及可读存储介质,该方法可以获取预设的目标敏感词,并查找与所述目标敏感词匹配的待检测文本;考虑到隐含各类违规内容的文本中可能包含各类变体及拼接文本,因而,可以对所述目标敏感词进行字符分割,得到多个敏感字,在所述待检测文本中定位每个敏感字,并从所述待检测文本中提取包含各个敏感字的待纠错片段;对所述待纠错片段进行文本校正,形成敏感文本,并对所述敏感文本进行流畅度校验;基于此,可以获取待检测文本的真正语义;然后,可以对通过校验的敏感文本进行违规识别;可见,本申请可以降低文本漏检率并提高违规文本识别的准确度。
技术关键词
文本识别方法
语义向量
文本校正
纠错
字符
文本识别设备
文本识别装置
校正模块
处理器
级联
识别模块
可读存储介质
存储器
非线性
程序
算法
系统为您推荐了相关专利信息
速度引导方法
事故多发路段
图像识别模型
编码
交通
医学影像数据
医学影像特征
关键词
文本
NoSQL数据库
解析器
指令处理器
区块链智能合约
抽象语法树
管理器