一种基于大模型对抗恶意蜘蛛池的方法

正文

推荐专利

一种基于大模型对抗恶意蜘蛛池的方法

申请号：CN202411377020

申请日期：2024-09-29

公开号：CN119149801B

公开日期：2025-01-24

类型：发明专利

摘要

本发明涉及网络安全技术领域，特别涉及一种基于大模型对抗恶意蜘蛛池的方法，其中，方法包括：基于爬虫在当前工作周期下返回的当前网页得到当前网页数据包的所有长尾关键词，输入预先训练的语义大模型得到当前网页数据包的所有目标关键词，由此检测当前网页是否满足预设相似条件，在满足预设相似条件的情况下，判定爬虫处于恶意蜘蛛池，并停止爬虫在当前网页的爬取。本发明实施例可以利用预训练大模型提取当前页面所有长尾关键词的对应的目标关键词，并构建网页特征向量，检测当前网页和先前网页的关键词相似程度，从而精准识别长尾关键词，以判断未知网页的相似性，快速诊断困入蜘蛛池的爬虫，保障了网络搜索的高效性和安全性，更加实用。

技术关键词

长尾关键词语义爬虫正确率历史页面标签数据网络安全技术切割模块计算机程序产品处理器工作周期生成用户识别模块可读存储介质文本

系统为您推荐了相关专利信息

地址匹配方法、装置及计算机设备

分词地址匹配方法文本非易失性存储介质纠错

一种基于深度学习的滨海湿地动态变化预测方法

滨海湿地语义分割网络地物类别像素输出特征

一种基于大语言模型的PDF文本提取方法及系统

文本提取方法大语言模型重构策略干扰特征识别策略

复杂场景小目标检测装置和方法、系统、存储介质

注意力机制特征提取模块深度强化学习卷积模块场景

一种基于多模态情感感知的智能对话控制方法及相关装置

语音音频数据智能对话控制方法智能外呼机器人音频特征数据语音情感识别模型

一种基于大模型对抗恶意蜘蛛池的方法

站点导航

APP 下载