一种基于大模型对抗恶意蜘蛛池的方法

AITNT
正文
推荐专利
一种基于大模型对抗恶意蜘蛛池的方法
申请号:CN202411377020
申请日期:2024-09-29
公开号:CN119149801B
公开日期:2025-01-24
类型:发明专利
摘要
本发明涉及网络安全技术领域,特别涉及一种基于大模型对抗恶意蜘蛛池的方法,其中,方法包括:基于爬虫在当前工作周期下返回的当前网页得到当前网页数据包的所有长尾关键词,输入预先训练的语义大模型得到当前网页数据包的所有目标关键词,由此检测当前网页是否满足预设相似条件,在满足预设相似条件的情况下,判定爬虫处于恶意蜘蛛池,并停止爬虫在当前网页的爬取。本发明实施例可以利用预训练大模型提取当前页面所有长尾关键词的对应的目标关键词,并构建网页特征向量,检测当前网页和先前网页的关键词相似程度,从而精准识别长尾关键词,以判断未知网页的相似性,快速诊断困入蜘蛛池的爬虫,保障了网络搜索的高效性和安全性,更加实用。
技术关键词
长尾关键词 语义 爬虫 正确率 历史页面 标签 数据 网络安全技术 切割模块 计算机程序产品 处理器 工作周期 生成用户 识别模块 可读存储介质 文本
系统为您推荐了相关专利信息
1
地址匹配方法、装置及计算机设备
分词 地址匹配方法 文本 非易失性存储介质 纠错
2
一种基于深度学习的滨海湿地动态变化预测方法
滨海湿地 语义分割网络 地物类别 像素 输出特征
3
一种基于大语言模型的PDF文本提取方法及系统
文本提取方法 大语言模型 重构策略 干扰特征 识别策略
4
复杂场景小目标检测装置和方法、系统、存储介质
注意力机制 特征提取模块 深度强化学习 卷积模块 场景
5
一种基于多模态情感感知的智能对话控制方法及相关装置
语音音频数据 智能对话控制方法 智能外呼机器人 音频特征数据 语音情感识别模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号