摘要
本发明涉及文本处理技术领域,具体涉及面向互联网的违规广告识别方法、设备及系统。该方法通过对广告携带的文本信息数据进行具体分析,对比分析特殊符号处理前后局部文本中每个分词的词性与词频的高分布一致情况,以及整体文本的相似情况,结合特殊符号前后词语的连接关联情况,得到特殊符号的必要处理程度;通过处理后的文本数据结合图像与发布时间的异常可能,评估广告的违规评分进行识别,得到更准确的评估结果。本发明通过比较特殊符号处理前后连贯文本内容所表示的语义变化情况,对广告文本中携带干扰特殊符号进行处理,提高广告违规信息识别的准确性,使违规广告识别更全面可靠。
技术关键词
广告识别方法
分词
字符
互联网
符号
数据
广告识别系统
文本处理技术
图像
指标
识别设备
处理器
序列
频率
处理单元
存储器
词语
语义
系统为您推荐了相关专利信息
信道状态信息
信道估计方法
多普勒
训练深度学习模型
时延