摘要
本发明公开一种基于大模型的多模态钓鱼网站检测方法,服务器提取目标网站URL地址的域名文本以及URL地址所对应的网页截图,随后将得到的域名文本和网页截图分别预处理得到文本初始特征和图片初始特征;通过神经网络深度学习模型CLIP处理得到文本特征和图片特征;计算得到的文本特征和图片特征之间的相似度,得到图文本相似度矩阵,并归一化处理得到图文本概率矩阵;将图文本概率矩阵通过分析选择器生成决策集和扩展集,最后通过分析决策集和扩展集,判断目标网站是否属于钓鱼网站。
技术关键词
钓鱼网站检测方法
图片
神经网络深度学习
矩阵
列表
决策
网站类别
报告
元素
分词
注意力机制
文本特征向量
服务器
编码
生成方法
代表
关键性
表达式
系统为您推荐了相关专利信息
广度优先搜索算法
信号覆盖范围
防冲突方法
聚类
编码
多模态特征融合
航班延误预测方法
融合特征
卷积特征
特征提取模块