摘要
本发明实施例提供了一种网页篡改的监测方法、计算机程序产品、设备及存储介质,方法包括:按照预定周期获取预定网页的页面快照;确定当前页面快照与历史页面快照的页面相似度;检测页面相似度是否达到预定相似度阈值;在页面相似度未达到预定相似度阈值的情况下,提取预定网页的文本内容;检测文本内容中是否存在预定敏感词库中的敏感词;在文本内容中不存在敏感词的情况下,通过预定语义分析模型再次检测文本内容中是否存在敏感词;在文本内容中存在敏感词的情况下,确定预定网页被篡改,并发出告警。本发明实施例减少了不必要的文本分析过程,保障了敏感词匹配的准确性,提升了检测效率,提高了检测准确率,减少漏报情况。
技术关键词
语义分析模型
文本
历史页面
快照
Word2Vec模型
计算机程序产品
分词
监测方法
处理器
存储器
同义词
计算机设备
周期
系统为您推荐了相关专利信息
内容生成方法
情感分析模型
内容生成系统
强化学习策略
多模态协同
对话生成方法
历史交互信息
大语言模型
场景
序列
地名字符串
编码向量
语义特征
翻译方法
音节切分方法
文本识别模型
键值
文本区域识别
填写方法
准确识别图像