摘要
本发明属于网站安全技术领域,公开了一种基于多模态融合的钓鱼网站检测方法,本发明提出了一种基于多模态深度学习模型的风险识别方法,能够更好地适应风险防控数据的多样性和不平衡性。本方法利用BERT模型提取文本特征、ViT模型提取图片特征,将二者拼接后输入逻辑斯蒂分类器进行风险识别。通过文本和图像信息的融合,本方法提升了对复杂风险模式的识别准确性。缓解数据不平衡问题:通过多模态特征融合,本技术能够从不同模态的数据中提取风险特征,减轻了由于正负样本比例失衡而导致的模型偏差问题。多模态特征的组合使得模型在少数类样本的学习中表现更加出色,有助于提升对稀缺和异常样本的识别能力。
技术关键词
钓鱼网站检测方法
钓鱼网站检测系统
文本特征向量
图像特征向量
信息数据处理终端
BERT模型
Hessian矩阵
图像特征提取模型
多模态深度学习
融合网络架构
爬虫技术
机器学习分类器
多模态特征融合
风险识别方法
系统为您推荐了相关专利信息
离线地图数据
多模态信息融合
二维图像数据
三维点云数据
能量管理方法
UI自动化测试方法
UI自动化测试技术
多头注意力机制
图像特征向量
回归测试用例
编码向量
标签
事件提取方法
文本特征向量
大语言模型